静默加载每个提示的所有MCP服务器会摧毁令牌预算

В посте на r/ClaudeAI сообщается о тонкой, но дорогостоящей проблеме: когда настроено несколько MCP-серверов, каждый запрос по умолчанию загружает их все, даже тривиальные вопросы. У пользователя было 5–6 серверов, и он не замечал этого, пока не проверил расход токенов — запросы тратили токены на загрузку нерелевантных определений серверов каждый раз.
Ключевые детали
- Каждый запрос загружал полный набор MCP-серверов (5–6 серверов).
- Даже простые запросы (например, «Который час?») вызывали загрузку всех определений серверов.
- Решение: пользовательский маршрутизирующий слой, который выбирает только серверы, релевантные запросу.
- Результат: расход токенов значительно снизился, а время ответа улучшилось.
- Автор признался, что «не может поверить, что так долго не проверял это».
Технический контекст
MCP (Model Context Protocol) серверы — это инструменты, расширяющие возможности Claude (например, доступ к файловой системе, запросы к базам данных, веб-скрапинг). Поведение по умолчанию во многих настройках — включая форкнутые клиенты и ручные конфигурации — заключается в отправке полного списка определений серверов с каждым сообщением. Это означает, что инструменты для доступа к БД, ввода-вывода файлов, веб-серфинга и т.д. сбрасываются в контекстное окно до обработки фактического пользовательского ввода.
Маршрутизирующий слой может анализировать сообщение пользователя (или системный промпт) и условно включать только те MCP-серверы, описания или инструменты которых соответствуют намерению. Например, запрос, упоминающий путь к файлу, активирует инструменты для работы с файлами; вопрос о ценах на акции загрузит только финансовый сервер. Это позволяет избежать расхода токенов на нерелевантные метаданные серверов.
Для кого это
Разработчики, запускающие Claude с несколькими MCP-серверами, особенно в автоматизированных пайплайнах или пользовательских интерфейсах, где важна эффективность использования токенов.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Маршрутизация снижает стоимость использования OpenClaw Max на 85%: с $200/мес до $30/мес с помощью API-маршрутизации
Пользователь отследил использование токенов и обнаружил, что только 15% задач требуют Opus. Маршрутизируя рутинную работу на Sonnet через API, ежемесячные расходы снизились с $200 до $30 при идентичном качестве вывода.

Шаблоны кода превосходят руководства по ИИ: перенос расширения Firefox в Chrome
Разработчик дважды безуспешно пытался перенести расширение Firefox на Chrome с помощью подсказок ИИ, но в итоге преуспел, выделив браузерно-независимую основную логику с интерфейсом BrowserShell, сократив специфичный для Chrome код до 5 значимых строк.

Формулирование диалогов с ИИ вместо написания идеальных запросов
Разработчик делится семью практическими техниками для улучшения ответов Claude AI, фокусируясь на контексте, ролях, последствиях и запросах на оценку, а не на идеальной формулировке промптов.

Утечка бюджета в OpenClaw API: Настройки, которые нужно изменить немедленно
Функция Heartbeat по умолчанию в OpenClaw может истощать бюджет API, проверяя задачи каждые 30 минут и загружая полные контекстные файлы, память и историю чата каждый раз. Источник рекомендует изменить активные часы, использовать более дешёвые базовые модели, вручную переключаться на премиум-модели только при необходимости и использовать команду /new для сброса сессий.