MCP-серверы: скрытое потребление токенов при каждом запросе

В посте на r/ClaudeAI сообщается о тонкой, но дорогостоящей проблеме: когда настроено несколько MCP-серверов, каждый запрос по умолчанию загружает их все, даже тривиальные вопросы. У пользователя было 5–6 серверов, и он не замечал этого, пока не проверил расход токенов — запросы тратили токены на загрузку нерелевантных определений серверов каждый раз.

Ключевые детали

Каждый запрос загружал полный набор MCP-серверов (5–6 серверов).
Даже простые запросы (например, «Который час?») вызывали загрузку всех определений серверов.
Решение: пользовательский маршрутизирующий слой, который выбирает только серверы, релевантные запросу.
Результат: расход токенов значительно снизился, а время ответа улучшилось.
Автор признался, что «не может поверить, что так долго не проверял это».

Технический контекст

MCP (Model Context Protocol) серверы — это инструменты, расширяющие возможности Claude (например, доступ к файловой системе, запросы к базам данных, веб-скрапинг). Поведение по умолчанию во многих настройках — включая форкнутые клиенты и ручные конфигурации — заключается в отправке полного списка определений серверов с каждым сообщением. Это означает, что инструменты для доступа к БД, ввода-вывода файлов, веб-серфинга и т.д. сбрасываются в контекстное окно до обработки фактического пользовательского ввода.

Маршрутизирующий слой может анализировать сообщение пользователя (или системный промпт) и условно включать только те MCP-серверы, описания или инструменты которых соответствуют намерению. Например, запрос, упоминающий путь к файлу, активирует инструменты для работы с файлами; вопрос о ценах на акции загрузит только финансовый сервер. Это позволяет избежать расхода токенов на нерелевантные метаданные серверов.

Для кого это

Разработчики, запускающие Claude с несколькими MCP-серверами, особенно в автоматизированных пайплайнах или пользовательских интерфейсах, где важна эффективность использования токенов.

📖 Прочитать полный источник: r/ClaudeAI

静默加载每个提示的所有MCP服务器会摧毁令牌预算

Ключевые детали

Технический контекст

Для кого это

👀 Смотрите также

Автоматизация перезапуска сессий Claude с помощью tmux и at

Проблемы квантования KV-кеша в локальных кодирующих агентах при больших длинах контекста

Самоанализ Claude Code выявил 3 ГБ мусора в ~/.claude — вот как это очистить

Построение с Codex, выполнение с OpenClaw: практическое разделение, которое работает