Аудит токенов Claude Code выявил скрытые расходы из-за загрузки инструментов по умолчанию.

Исследование потерь токенов выявило значительные накладные расходы
Разработчик провёл аудит 926 сессий Claude Code после того, как заметил быстрое потребление токенов после изменений лимитов скорости от Anthropic. Исследование показало, что каждая сессия Claude Code начинается с базовой нагрузкой примерно в 45 000 токенов до любого пользовательского ввода. Это включает системные промпты, определения инструментов, описания агентов, файлы памяти, описания навыков и схемы MCP.
При стандартном окне контекста в 200 000 токенов эта начальная нагрузка в 45 000 представляет собой более 20% доступного контекста, потребляемого до начала любого диалога. Поскольку Claude Code работает как цикл без сохранения состояния, весь этот контекст перестраивается и пересылается с каждым ходом, делая начальные накладные расходы повторяющимися.
Загрузка инструментов по умолчанию потребляет значительное количество токенов
Аудит показал, что 20 000 токенов начального контекста приходится на определения схем системных инструментов. По умолчанию Claude Code загружает полную JSON-схему для каждого доступного инструмента в контекст при запуске сессии, независимо от того, будут ли эти инструменты использоваться.
Разработчик обнаружил настройку под названием enable_tool_search, которая включает отложенную загрузку инструментов. При включении эта настройка загружает только 6 основных инструментов изначально, а остальные подгружает по требованию, вместо того чтобы выгружать все схемы инструментов сразу.
Изменение конфигурации даёт немедленную экономию
Чтобы включить отложенную загрузку инструментов, добавьте это в ваш settings.json:
{
"env": {
"ENABLE_TOOL_SEARCH": "true"
}
}Это единственное изменение конфигурации сократило начальный контекст с 45 000 до 20 000 токенов, при этом накладные расходы на системные инструменты упали с 20 000 до 6 000 токенов. Это экономит 14 000 токенов на каждом ходе каждой сессии.
Финансовые последствия настроек по умолчанию
Разработчик рассчитал влияние этой одной настройки на своё использование. При среднем количестве 22 ходов на сессию дополнительные 14 000 токенов за ход составили 308 000 лишних токенов за сессию. На 858 сессиях это составило 264 миллиона токенов.
При цене чтения из кэша ($0.50/MTok) это представляло $132 ненужных расходов. Однако, поскольку более половины ходов попадали в просроченный кэш (что запускает полную цену ввода по $5/MTok), фактическая стоимость оценивалась от $132 до $1 300 только из-за этой одной настройки по умолчанию.
Дополнительные стратегии оптимизации
Разработчик также внедрил другие оптимизации, которые сократили начальный контекст на 4 000–5 000 токенов:
- Обрезка и переработка файлов CLAUDE markdown и памяти
- Консолидация описаний навыков
- Отключение неиспользуемых MCP-серверов
- Ужесточение инъекций схем из хуков памяти
Claude Code хранит диалоги в виде JSONL-файлов локально в ~/.claude/projects/, хотя встроенного способа получить детальную разбивку по сессиям, стоимости на проект или категориям расходов нет. Встроенная команда /insights оказалась недостаточной для диагностики потерь.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Советы по использованию токенов для Claude Code
Практические советы из поста на Reddit о сокращении расхода токенов: начинайте новые чаты, группируйте вопросы, держите CLAUDE.md кратким, точно указывайте файлы, обобщайте и перезапускайте беседы, а для простых задач используйте более легкие модели.

Пользователь Claude делится промтом «Не управляйте моими чувствами» для получения прямых технических отзывов
Пользователь Claude рекомендует установить определённый промпт в настройках пользователя, чтобы сократить вступительные фразы и получать более прямые технические отзывы. Промпт указывает Claude пропускать дипломатические формулировки и давать прямую критику технических и творческих работ.

Ошибка в плагине Claude Code приводит к двойной загрузке навыков, увеличивая сжатие контекста.
Ошибка в Claude Code приводит к двойной загрузке каждого плагина из-за устаревших кэш-директорий и дублирования символьных ссылок, что значительно увеличивает размер системного промпта и вызывает частое сжатие контекста. В источнике предоставлены скрипты для проверки проблемы и исправления, которые удаляют устаревшие версии плагинов и дублирующиеся символьные ссылки.

Обработка запусков агентов как пакетов ревью: практический паттерн для Claude Code и Codex
Разработчик делится, как структурированная папка на каждый запуск агента (исследования, черновики, оценки, пакет на одобрение, метрики, память) делает ошибки видимыми и ускоряет итерации.