Одновызовный конвейер MCP сокращает использование токенов Claude Code на 74%

✍️ OpenClawRadar📅 Опубликовано: 1 марта 2026 г.🔗 Source
Одновызовный конвейер MCP сокращает использование токенов Claude Code на 74%
Ad

Разработчик поделился опытом создания контекстного движка (MCP-сервера), который предоставляет Claude Code граф зависимостей кодовых баз, позволяя ему читать только релевантный код вместо целых файлов. Инструмент значительно сокращает использование токенов, предоставляя графы зависимостей и скелеты вместо исходных файлов.

Исходная проблема и первоначальное решение

Claude Code обычно читает целые файлы и помещает всё в контекст, что быстро расходует токены. Первоначальный подход заключался в предоставлении только релевантного кода через MCP с использованием графов зависимостей и скелетов вместо исходных файлов, что само по себе сократило использование токенов на 65%.

Выявленная неэффективность и решение

Пользователи указали, что сам рабочий процесс MCP был расточительным: агенты выполняли несколько циклов обмена данными: вызов get_context_capsule, чтение результата, затем вызов get_impact_graph, чтение этого результата, за которым следовал search_memory и чтение этого результата. Это создавало три цикла обмена данными с перекрывающимися результатами в контексте.

Исправление run_pipeline

Разработчик выпустил инструмент MCP с одним вызовом под названием run_pipeline, который заменяет многоэтапный рабочий процесс. Инструмент автоматически определяет намерение (отладка/изменение/рефакторинг/исследование) и запускает соответствующую комбинацию поиска контекста, анализа влияния и вызова памяти на стороне сервера.

run_pipeline({
  task: "fix JWT validation bug",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT uses Ed25519" // сохранить инсайт в том же вызове
})

Этот единственный вызов заменяет 3-4 отдельных вызова. Результаты дедуплицируются и объединяются в рамках бюджета токенов перед попаданием в контекстное окно, что приводит к примерно на 60% меньшему количеству контекстных токенов по сравнению с вызовом инструментов по отдельности. Параметр observation позволяет агентам сохранять полученную информацию в том же вызове без отдельного шага save_observation. Память связана с узлами графа кода, поэтому при изменении кода наблюдения автоматически помечаются как устаревшие.

Ad

Дополнительные выпущенные функции

  • Пассивный конвейер наблюдения: наблюдатель за файлами → вычисление разницы хэшей blake3 → структурные различия на уровне AST → автоматическая корреляция с вызовами инструментов → наблюдения без настройки
  • CLI, работающий без VS Code: npm install -g vexp-cli
  • Git-хуки, которые не перезаписывают существующие (блоки с разделителями-маркерами)
  • Отображение экономии токенов в боковой панели VS Code с фактическими цифрами за скользящее 24-часовое окно

Доступность

Инструмент можно бесплатно опробовать с щедрым бесплатным тарифом, предлагающим 2000 узлов, базовую функциональность конвейера и полную память сеанса. Не требуется учётная запись или API-ключ, и он не выполняет сетевых вызовов. Базовая архитектура включает движок графов на Rust и парсеры tree-sitter, созданные разработчиком, при этом Claude Code помогал с уровнем протокола MCP, миграциями схем SQLite и шаблонами инструкций для агентов.

📖 Прочитать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Ouroboros добавляет режим интервью с менеджером проектов для Claude Code, чтобы сократить разрыв между спецификациями.
Инструменты

Ouroboros добавляет режим интервью с менеджером проектов для Claude Code, чтобы сократить разрыв между спецификациями.

Теперь Ouroboros включает режим PM, который запускает управляемое интервью перед передачей задачи Claude Code, задавая вопросы о решаемой проблеме, целевой аудитории и важных ограничениях. Результатом является документ PRD/PM с целями, пользовательскими историями, ограничениями, критериями успеха, предположениями и отложенными задачами.

OpenClawRadar
Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE
Инструменты

Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE

Resonant Genesis AI IDE интегрирует поддержку локальных LLM как полноценного провайдера наряду с Groq, OpenAI, Anthropic и Gemini в более чем 30 микросервисах, используя общую библиотеку UnifiedLLMClient с автоматической цепочкой отказов.

OpenClawRadar
Режим контекста: MCP-сервер, который сжимает выводы инструментов для Claude Code
Инструменты

Режим контекста: MCP-сервер, который сжимает выводы инструментов для Claude Code

Контекстный режим — это сервер MCP, который находится между Claude Code и выводами инструментов, обрабатывая их в песочницах и возвращая только сводки. Он сокращает 315 КБ вывода MCP до 5,4 КБ, увеличивая время сессии до замедления с ~30 минут до ~3 часов.

OpenClawRadar
Открытая система поиска работы на основе ИИ, созданная с помощью Claude Code, оценивает предложения и генерирует адаптированные резюме
Инструменты

Открытая система поиска работы на основе ИИ, созданная с помощью Claude Code, оценивает предложения и генерирует адаптированные резюме

Разработчик открыл исходный код проекта Claude Code, который превращает ваш терминал в командный центр поиска работы. Система оценивает предложения о работе по 10 параметрам, генерирует PDF-резюме, оптимизированные для систем отслеживания кандидатов, сканирует более 45 страниц карьеры компаний и включает 14 режимов навыков.

OpenClawRadar