Madar: Локальный компилятор контекста для Claude Code / Cursor — на 78% меньше токенов в репозитории NestJS

Madar — это локальный компилятор контекста с открытым исходным кодом для агентов кодирования, таких как Claude Code, Cursor, Copilot и Gemini. Он однократно составляет карту вашего репозитория TypeScript/Node.js (локально, без зависимостей машинного обучения) и для каждого запроса предоставляет минимальный пакет контекста через MCP, избегая повторного обнаружения кодовой базы агентом по умолчанию в каждом сеансе.
Как это работает
Установите глобально и сгенерируйте граф, ограниченный вашим серверным сервисом, используя --spi (изоляция одного пакета):
npm i -g @lubab/madar
madar generate . --spi
madar claude install # или: madar cursor install / madar copilot installИнструмент детерминирован — чистый статический анализ импортов и путей вызовов, никаких эмбеддингов, никаких вызовов моделей.
Бенчмарк на NestJS + BullMQ (~800 файлов)
Один и тот же вопрос («как генерируется отчет об идее») был задан Claude Code с Madar и без него. Цифры из отчетов Anthropic:
- Входные токены: 1 000 776 (без Madar) → 223 539 (с Madar) — снижение на 78%
- Стоимость: $1,84 → $0,69 — экономия 63%
- Шаги: 16 → 5
- Вызовы инструментов: 15 → 4
Когда это не работает
Автор честно рассказывает об ограничениях:
- Протестировано только на одном репозитории, одном агенте, одном типе вопросов («как работает X»). Не является общим утверждением.
- Разграничение критически важно: использование
--spiдля одного сервиса сработало; применение ко всему монорепозиторию приводило к появлению пакетов контекста, которые могли увеличивать использование токенов. - Задачи на редактирование/рецензирование еще не проверены — выигрыш только для запросов типа «объясни».
- Пока работает только для кодовых баз TypeScript/Node.js.
Для кого это
Для разработчиков, работающих с большими репозиториями NestJS, Express или Node.js, которые используют ИИ-агенты кодирования и хотят сократить расход токенов на повторяющийся сбор контекста. Не подходит для монорепозиториев без тщательного разграничения.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Результаты тестирования: Когда использовать Claude Opus с Codex или чистый Opus для генерации кода
Контрольный тест проверил подход 'Планирование с Opus, выполнение с Codex' на трех реальных задачах программирования. Результаты показывают точку пересечения затрат примерно на 600 строках кода с конкретными рекомендациями в зависимости от размера проекта.

Плагин OpenClaw Memos решает проблемы передачи памяти в AI-агентах для программирования.
Пользователь Reddit рассказывает, как утечка кода Claude выявила проблемы с передачей памяти в AI-агентах для программирования, где раздутые транскрипты вызывают сложности при смене моделей. Они внедрили плагин memos в OpenClaw со стратегией выборочного восстановления, чтобы сжимать недавнюю работу и отбрасывать устаревшие вызовы инструментов.

Разработчик тестирует Qwen3.5 27B в сравнении с более крупными моделями для локальных задач программирования.
Разработчик протестировал несколько моделей Qwen3.5 и Nemotron, обнаружив, что Qwen3.5-27B-GGUF:UD-Q6_K_XL хорошо подходит для задач разработки на существующем оборудовании с 2x RTX 3090, показывая 803 pp и 25 tg/s при контексте 256k на vast.ai.

одноразовое чтение: Крючок Кода Клода, Предотвращающий Избыточное Чтение Файлов
Разработчик создал PreToolUse-хук под названием read-once, который отслеживает файлы, уже прочитанные Claude Code в сессии, блокируя повторное чтение неизмененных файлов и используя различия для измененных файлов. Этот инструмент экономит тысячи токенов за сессию, предотвращая многократное чтение Claude одного и того же содержимого файлов.