Одновызовный конвейер MCP сокращает использование токенов Claude Code на 74%

Разработчик поделился опытом создания контекстного движка (MCP-сервера), который предоставляет Claude Code граф зависимостей кодовых баз, позволяя ему читать только релевантный код вместо целых файлов. Инструмент значительно сокращает использование токенов, предоставляя графы зависимостей и скелеты вместо исходных файлов.
Исходная проблема и первоначальное решение
Claude Code обычно читает целые файлы и помещает всё в контекст, что быстро расходует токены. Первоначальный подход заключался в предоставлении только релевантного кода через MCP с использованием графов зависимостей и скелетов вместо исходных файлов, что само по себе сократило использование токенов на 65%.
Выявленная неэффективность и решение
Пользователи указали, что сам рабочий процесс MCP был расточительным: агенты выполняли несколько циклов обмена данными: вызов get_context_capsule, чтение результата, затем вызов get_impact_graph, чтение этого результата, за которым следовал search_memory и чтение этого результата. Это создавало три цикла обмена данными с перекрывающимися результатами в контексте.
Исправление run_pipeline
Разработчик выпустил инструмент MCP с одним вызовом под названием run_pipeline, который заменяет многоэтапный рабочий процесс. Инструмент автоматически определяет намерение (отладка/изменение/рефакторинг/исследование) и запускает соответствующую комбинацию поиска контекста, анализа влияния и вызова памяти на стороне сервера.
run_pipeline({
task: "fix JWT validation bug",
preset: "auto",
max_tokens: 10000,
observation: "JWT uses Ed25519" // сохранить инсайт в том же вызове
})
Этот единственный вызов заменяет 3-4 отдельных вызова. Результаты дедуплицируются и объединяются в рамках бюджета токенов перед попаданием в контекстное окно, что приводит к примерно на 60% меньшему количеству контекстных токенов по сравнению с вызовом инструментов по отдельности. Параметр observation позволяет агентам сохранять полученную информацию в том же вызове без отдельного шага save_observation. Память связана с узлами графа кода, поэтому при изменении кода наблюдения автоматически помечаются как устаревшие.
Дополнительные выпущенные функции
- Пассивный конвейер наблюдения: наблюдатель за файлами → вычисление разницы хэшей blake3 → структурные различия на уровне AST → автоматическая корреляция с вызовами инструментов → наблюдения без настройки
- CLI, работающий без VS Code:
npm install -g vexp-cli - Git-хуки, которые не перезаписывают существующие (блоки с разделителями-маркерами)
- Отображение экономии токенов в боковой панели VS Code с фактическими цифрами за скользящее 24-часовое окно
Доступность
Инструмент можно бесплатно опробовать с щедрым бесплатным тарифом, предлагающим 2000 узлов, базовую функциональность конвейера и полную память сеанса. Не требуется учётная запись или API-ключ, и он не выполняет сетевых вызовов. Базовая архитектура включает движок графов на Rust и парсеры tree-sitter, созданные разработчиком, при этом Claude Code помогал с уровнем протокола MCP, миграциями схем SQLite и шаблонами инструкций для агентов.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Ouroboros добавляет режим интервью с менеджером проектов для Claude Code, чтобы сократить разрыв между спецификациями.
Теперь Ouroboros включает режим PM, который запускает управляемое интервью перед передачей задачи Claude Code, задавая вопросы о решаемой проблеме, целевой аудитории и важных ограничениях. Результатом является документ PRD/PM с целями, пользовательскими историями, ограничениями, критериями успеха, предположениями и отложенными задачами.

Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE
Resonant Genesis AI IDE интегрирует поддержку локальных LLM как полноценного провайдера наряду с Groq, OpenAI, Anthropic и Gemini в более чем 30 микросервисах, используя общую библиотеку UnifiedLLMClient с автоматической цепочкой отказов.

Режим контекста: MCP-сервер, который сжимает выводы инструментов для Claude Code
Контекстный режим — это сервер MCP, который находится между Claude Code и выводами инструментов, обрабатывая их в песочницах и возвращая только сводки. Он сокращает 315 КБ вывода MCP до 5,4 КБ, увеличивая время сессии до замедления с ~30 минут до ~3 часов.

Открытая система поиска работы на основе ИИ, созданная с помощью Claude Code, оценивает предложения и генерирует адаптированные резюме
Разработчик открыл исходный код проекта Claude Code, который превращает ваш терминал в командный центр поиска работы. Система оценивает предложения о работе по 10 параметрам, генерирует PDF-резюме, оптимизированные для систем отслеживания кандидатов, сканирует более 45 страниц карьеры компаний и включает 14 режимов навыков.