Анализ Совета LLM выявляет практические стратегии оптимизации токенов кода Claude.

Проблема и настройка эксперимента
Разработчик, ежедневно сталкивавшийся с лимитами использования Claude Code, провёл эксперимент с помощью LLM Council (https://github.com/karpathy/llm-council). Настройка включала 5 различных персонажей, которые были вынуждены критиковать, оспаривать и улучшать решения, после чего следовал раунд взаимной оценки.
Ключевые выводы
Анализ показал, что основным потребителем токенов была не сложность задач, а использование "режима мышления" по умолчанию. Только это сжигало токены почти как у Opus.
Практические привычки оптимизации
- Отключайте расширенное мышление по умолчанию
- /clear после каждого коммита git (без исключений)
- Прекратите писать промпты "да / продолжай"
- /compact примерно каждые 40 сообщений
- Держите CLAUDE.md минимальным, иначе платите налог каждый сеанс
Ментальный сдвиг и результаты
Основное понимание: Перестаньте воспринимать интеллект как нечто само собой разумеющееся. Относитесь к нему как к ресурсу, который вы намеренно задействуете. Этот сдвиг позволяет:
- Мгновенную экономию 30-50% токенов
- Возможность реально использовать Opus без страха
- Предсказуемый ежедневный рабочий процесс вместо случайных превышений лимита
Совет подчеркнул одно правило: Если вы не отслеживаете /cost, вы не оптимизируете... вы гадаете.
Итог
При полной реализации плана действий:
- Сокращение использования токенов на ~60-70%
- Такое же или лучшее качество вывода
- Opus становится пригодным для высокоценной работы
Разработчик отметил, что этот подход был эффективнее любого отдельного трюка с промптами.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Перенаправляйте рутинную работу с Claude Code на Gemma через MCP-сервер offload-mcp
offload-mcp — это новый MCP-сервер, который позволяет Claude переносить рутинные задачи, такие как сообщения коммитов и сводки PR, на бесплатные API моделей (по умолчанию Gemma через Google GenAI API), экономя токены Claude и выполняя облегченную работу без ограничений локального оборудования.

Терминальный 3D-рендерер, созданный с помощью мультиагентной системы кодирования Claude
Разработчик создал tortuise — чисто терминальный 3D-рендерер, отображающий гауссовы сплаты с помощью символов Unicode и ASCII, построенный за 3 дня с использованием 70-80 ИИ-агентов, скоординированных через настройку Claude Code с подагентами внутри подагентов.

Клукс: Постоянная среда выполнения хуков для Claude Code
Clooks — это постоянный HTTP-демон, который обрабатывает диспетчеризацию хуков Claude Code без создания новых процессов, сокращая задержку с ~34,6 мс до ~0,31 мс на вызов. Он включает автоматическую миграцию, обработчики LLM с шаблонами промптов, разрешение зависимостей и упаковку плагинов.

EctoLedger: Открытый микроВМ-песочница для локальных ИИ-агентов с доступом к терминалу
EctoLedger — это открытый рантайм-брандмауэр и реестр, обеспечивающий изоляцию микровиртуальных машин для локальных ИИ-агентов с доступом к терминалу, запускающий четыре уровня защиты перед выполнением команд в среде Apple Hypervisor.framework (macOS) или микровиртуальной машины Firecracker (Linux).