Сэкономьте на счетах за Claude Code, направив токены планирования на более дешевые модели

✍️ OpenClawRadar📅 Опубликовано: 8 мая 2026 г.🔗 Source
Сэкономьте на счетах за Claude Code, направив токены планирования на более дешевые модели
Ad

Пользователь Reddit сообщает, что в прошлом месяце сэкономил около $40 на дополнительных сборах в Claude Code, распределив использование токенов между моделями. Ключевая идея: этапы планирования (особенно при рефакторинге нескольких файлов) могут потреблять до 80% бюджета токенов, но для большинства задач планирования не нужна самая дорогая модель.

Как это работает

Они написали обёртку из 30 строк, которая направляет начальную работу по определению изменений на Haiku 3.5 — более дешёвую модель. Только сами правки и принятие решений остаются на Opus или Sonnet. Настройка заняла около 2 часов, включая выяснение того, какие шаги стоит передать.

Результаты

В последнем цикле впервые за 4 месяца остался остаток бюджета. Пользователь избежал обычного 2-дневного ожидания окна сброса. Экономия: примерно $40 на дополнительных сборах.

# Псевдокод логики обёртки:
# 1. Отправить запрос на планирование в haiku-3.5
# 2. Получить список файлов и изменений
# 3. Передать план и инструкцию в opus/sonnet для фактических правок
Ad

Оговорки

Качество планирования Haiku заметно хуже в архитектурных решениях. Для рабочих процессов рефакторинга и тестирования, где Opus всё равно принимает реальные решения, это нормально. Для проектирования с нуля ("чем должно быть это приложение") пользователь по-прежнему позволяет Opus планировать с нуля.

Пользователь отмечает, что этот шаблон "вероятно, очевиден для тех, кто смотрел таблицы цен моделей OpenRouter", но документация по под-агентам Claude Code скудна по данному подходу.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Коллаборативные и директивные промпты для ИИ приводят к разным результатам.
Советы

Коллаборативные и директивные промпты для ИИ приводят к разным результатам.

Обсуждение на Reddit выявляет измеримые различия в результатах разработки с помощью ИИ между пользователями, которые сотрудничают с ИИ, используя язык "мы", и теми, кто даёт директивные команды "сделай это". Совместный подход выявляет тупиковые пути и ставит под сомнение предположения через общий контекст.

OpenClawRadar
Использование Cron Jobs в OpenClaw для запланированных задач вместо мониторинга Heartbeat
Советы

Использование Cron Jobs в OpenClaw для запланированных задач вместо мониторинга Heartbeat

В посте на Reddit объясняется, как использовать функцию cron-заданий OpenClaw для планирования задач, таких как утренние брифинги и сортировка писем, с критически важным флагом --session isolated для предотвращения утечки контекста, а также предупреждается о возможных ошибках в изолированных сессиях в разных версиях.

OpenClawRadar
20 команд Claude Code, которые должен знать каждый разработчик
Советы

20 команд Claude Code, которые должен знать каждый разработчик

Пост на Reddit перечисляет 20 команд Claude Code для остановки задач, управления контекстом, ответвлений, удаленного управления и ярлыков продуктивности, таких как /compact, /branch и /simplify.

OpenClawRadar
Управление контекстным окном кода Claude для оптимизации затрат и производительности
Советы

Управление контекстным окном кода Claude для оптимизации затрат и производительности

Разработчик объясняет, что каждый вызов API отправляет полную историю разговора, делая накопленную историю дорогостоящей частью, и делится рабочим процессом: запуск новых сессий с заметками для передачи контекста, чтобы снизить затраты и повысить качество ответов.

OpenClawRadar