Прекратите сжигать токены Claude Code на чат-вопросы

Один разработчик на r/ClaudeAI каждую неделю к четвергу исчерпывал свой лимит в $20 на Claude Code. Проанализировав последние 50 запросов, он понял, что большинство из них были простыми вопросами, не требующими агента: «что означает этот стектрейс», «регулярное выражение для поиска X», «объясни, что делает этот однострочник на bash», «преобразуй этот curl в httpie» и «как с помощью jq извлечь поле Y из этого».
Каждый такой запрос в Claude Code оплачивал полную «агентскую таксу» — загрузку контекста, определения инструментов, токены планирования — ради ответа в одну строку. Решение: все вопросы в формате чата направлять в обычное окно чата с дешевой моделью (Haiku или GPT-mini). Claude Code оставить для редактирования нескольких файлов, рефакторинга и отладки, где действительно нужно чтение кодовой базы.
Результаты примерно через 3 недели
- Перестал исчерпывать еженедельный лимит к четвергу, выполняя тот же объем работы.
- Дополнительные расходы на вызовы дешевых моделей: около $3–4 в неделю — незначительно.
- Побочный эффект: ответы от дешевых моделей приходят быстрее, чем Claude Code запускает свой агентский цикл, поэтому быстрые вопросы решаются быстрее.
Заметка о рабочем процессе
Чтобы не переключаться между терминалом (Claude Code) и окном чата, теперь он использует терминал под названием yaw.sh, который размещает мультипровайдерный чат в строке приглашения рядом с Claude Code. Но подойдет любой чатовый инструмент в другом окне — суть в изменении рабочего процесса, что и экономит токены.
TL;DR: Если вы исчерпываете еженедельный лимит Claude Code, проанализируйте свои последние 50 запросов. Скорее всего, большинству из них не нужен агент. Перенаправьте их, и вы, вероятно, перестанете упираться в лимит.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Использование описаний проектов для управления памятью в крупных проектах OpenClaw
Разработчик делится процессом, при котором после каждого крупного этапа он запускает отдельного работника OpenClaw для анализа кодовой базы и написания документа «нарратива проекта», который помогает выявить сломанные конвейеры, избыточности и недостающие элементы, которые основной работник может упустить.

Остановите длинные тире Клода одной строкой в настройках или Claude.md
Добавьте конкретную фразу в настройки профиля Claude.ai или Claude.md, чтобы снизить количество длинных тире примерно на 98%. Это практическая настройка, проверенная сообществом.
Claude + MCP Browser: пользователи сообщают об улучшенном доступе в интернет
Пользователь Claude рассказывает, как подключение к внешнему браузеру через MCP позволило ИИ обходить ранее недоступные сайты, и задаётся вопросом, может ли Claude использовать токены модели браузера.

Как нон-кодер создал переиспользуемый рабочий процесс на Claude для контент-маркетинга основателя
Бывший редактор журнала без опыта программирования рассказывает, как случайно создал повторяемый рабочий процесс с Claude для контент-маркетинга соло-основателя: выгрузить сырые мысли, затем переструктурировать с помощью Claude в форматы для конкретных платформ.