Как сэкономить токены Claude Code: используйте Haiku для простых вопросов

Один разработчик на r/ClaudeAI каждую неделю к четвергу исчерпывал свой лимит в $20 на Claude Code. Проанализировав последние 50 запросов, он понял, что большинство из них были простыми вопросами, не требующими агента: «что означает этот стектрейс», «регулярное выражение для поиска X», «объясни, что делает этот однострочник на bash», «преобразуй этот curl в httpie» и «как с помощью jq извлечь поле Y из этого».

Каждый такой запрос в Claude Code оплачивал полную «агентскую таксу» — загрузку контекста, определения инструментов, токены планирования — ради ответа в одну строку. Решение: все вопросы в формате чата направлять в обычное окно чата с дешевой моделью (Haiku или GPT-mini). Claude Code оставить для редактирования нескольких файлов, рефакторинга и отладки, где действительно нужно чтение кодовой базы.

Результаты примерно через 3 недели

Перестал исчерпывать еженедельный лимит к четвергу, выполняя тот же объем работы.
Дополнительные расходы на вызовы дешевых моделей: около $3–4 в неделю — незначительно.
Побочный эффект: ответы от дешевых моделей приходят быстрее, чем Claude Code запускает свой агентский цикл, поэтому быстрые вопросы решаются быстрее.

Заметка о рабочем процессе

Чтобы не переключаться между терминалом (Claude Code) и окном чата, теперь он использует терминал под названием yaw.sh, который размещает мультипровайдерный чат в строке приглашения рядом с Claude Code. Но подойдет любой чатовый инструмент в другом окне — суть в изменении рабочего процесса, что и экономит токены.

TL;DR: Если вы исчерпываете еженедельный лимит Claude Code, проанализируйте свои последние 50 запросов. Скорее всего, большинству из них не нужен агент. Перенаправьте их, и вы, вероятно, перестанете упираться в лимит.

📖 Read the full source: r/ClaudeAI

Прекратите сжигать токены Claude Code на чат-вопросы

Результаты примерно через 3 недели

Заметка о рабочем процессе

👀 Смотрите также

Как я взаимодействую с ИИ-моделями в 2026 году по сравнению с прошлым годом: 3 ключевых изменения

Claude Code Безголовый режим с флагом --print

Попросите ИИ определить свои термины на основе первых принципов для улучшения результатов и проверяемости рассуждений

Claude Code лучше работает в качестве рецензента кода, чем генератора.