Анализ Совета LLM выявляет практические стратегии оптимизации токенов кода Claude.

✍️ OpenClawRadar📅 Опубликовано: 14 апреля 2026 г.🔗 Source
Анализ Совета LLM выявляет практические стратегии оптимизации токенов кода Claude.
Ad

Проблема и настройка эксперимента

Разработчик, ежедневно сталкивавшийся с лимитами использования Claude Code, провёл эксперимент с помощью LLM Council (https://github.com/karpathy/llm-council). Настройка включала 5 различных персонажей, которые были вынуждены критиковать, оспаривать и улучшать решения, после чего следовал раунд взаимной оценки.

Ключевые выводы

Анализ показал, что основным потребителем токенов была не сложность задач, а использование "режима мышления" по умолчанию. Только это сжигало токены почти как у Opus.

Практические привычки оптимизации

  • Отключайте расширенное мышление по умолчанию
  • /clear после каждого коммита git (без исключений)
  • Прекратите писать промпты "да / продолжай"
  • /compact примерно каждые 40 сообщений
  • Держите CLAUDE.md минимальным, иначе платите налог каждый сеанс
Ad

Ментальный сдвиг и результаты

Основное понимание: Перестаньте воспринимать интеллект как нечто само собой разумеющееся. Относитесь к нему как к ресурсу, который вы намеренно задействуете. Этот сдвиг позволяет:

  • Мгновенную экономию 30-50% токенов
  • Возможность реально использовать Opus без страха
  • Предсказуемый ежедневный рабочий процесс вместо случайных превышений лимита

Совет подчеркнул одно правило: Если вы не отслеживаете /cost, вы не оптимизируете... вы гадаете.

Итог

При полной реализации плана действий:

  • Сокращение использования токенов на ~60-70%
  • Такое же или лучшее качество вывода
  • Opus становится пригодным для высокоценной работы

Разработчик отметил, что этот подход был эффективнее любого отдельного трюка с промптами.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Перенаправляйте рутинную работу с Claude Code на Gemma через MCP-сервер offload-mcp
Инструменты

Перенаправляйте рутинную работу с Claude Code на Gemma через MCP-сервер offload-mcp

offload-mcp — это новый MCP-сервер, который позволяет Claude переносить рутинные задачи, такие как сообщения коммитов и сводки PR, на бесплатные API моделей (по умолчанию Gemma через Google GenAI API), экономя токены Claude и выполняя облегченную работу без ограничений локального оборудования.

OpenClawRadar
Терминальный 3D-рендерер, созданный с помощью мультиагентной системы кодирования Claude
Инструменты

Терминальный 3D-рендерер, созданный с помощью мультиагентной системы кодирования Claude

Разработчик создал tortuise — чисто терминальный 3D-рендерер, отображающий гауссовы сплаты с помощью символов Unicode и ASCII, построенный за 3 дня с использованием 70-80 ИИ-агентов, скоординированных через настройку Claude Code с подагентами внутри подагентов.

OpenClawRadar
Клукс: Постоянная среда выполнения хуков для Claude Code
Инструменты

Клукс: Постоянная среда выполнения хуков для Claude Code

Clooks — это постоянный HTTP-демон, который обрабатывает диспетчеризацию хуков Claude Code без создания новых процессов, сокращая задержку с ~34,6 мс до ~0,31 мс на вызов. Он включает автоматическую миграцию, обработчики LLM с шаблонами промптов, разрешение зависимостей и упаковку плагинов.

OpenClawRadar
EctoLedger: Открытый микроВМ-песочница для локальных ИИ-агентов с доступом к терминалу
Инструменты

EctoLedger: Открытый микроВМ-песочница для локальных ИИ-агентов с доступом к терминалу

EctoLedger — это открытый рантайм-брандмауэр и реестр, обеспечивающий изоляцию микровиртуальных машин для локальных ИИ-агентов с доступом к терминалу, запускающий четыре уровня защиты перед выполнением команд в среде Apple Hypervisor.framework (macOS) или микровиртуальной машины Firecracker (Linux).

OpenClawRadar