Сократить расходы на OpenClaw Agent на 80%: смена модели

Пользователь Reddit две недели вручную записывал каждое взаимодействие с агентом OpenClaw, чтобы понять, на что уходят деньги. Результаты — четкий план оптимизации расходов на AI-агентов.

Разбивка

За 14 дней использования агента в Telegram + Discord использование токенов распределилось так:

Heartbeats (опрос каждые 30 мин) — 38% использования. Запуск на Opus за ~$6.75/M токенов. Полная трата для проверки статуса.
Чтение файлов и сводки — 29% использования. Тоже на Opus. Flash справляется идентично.
Обычные разговоры — 22% использования. Здесь качество модели имеет значение.
Сложные задачи — 11% использования. Где Opus действительно превосходит Flash.

В целом 67% расходов приходилось на задачи, где DeepSeek V4 Flash ($0.14/M) обеспечивает то же качество, что и Opus ($6.75/M с учетом токенизатора).

Решение: Flash по умолчанию, повышение только при необходимости

Установите основную модель как deepseek/deepseek-v4-flash в openclaw.json:

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}

Затем используйте /model anthropic/claude-opus-4-7 во время сессии, когда сталкиваетесь с действительно сложной задачей. Переключение мгновенное — без перезапуска, в той же сессии. Введите /model deepseek/deepseek-v4-flash, когда закончите, чтобы вернуться к дешевой модели.

Результаты

Расходы снизились с ~$170/месяц до ~$35/месяц. Разница в качестве для heartbeats, чтения файлов и простых вопросов была буквально нулевой.

Пользователь отмечает, что бесплатный тариф BetterClaw (с BYOK) теперь показывает затраты API на задачу, что сразу выявило бы траты на heartbeats. Но главный вывод — переключение основной модели на Flash и повышение до Opus только при необходимости — вот что действительно важно.

📖 Read the full source: r/openclaw

Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели

Разбивка

Решение: Flash по умолчанию, повышение только при необходимости

Результаты

👀 Смотрите также

Пользовательский хук PostToolUse для загрузки CLAUDE.md по требованию вне дерева проекта

Управление несколькими агентами в OpenClaw: централизация правил и порождение подчиненных агентов

禁用 Opus 4.7 人类步调行为的 CLAUDE.md 条目

Как нон-кодер создал переиспользуемый рабочий процесс на Claude для контент-маркетинга основателя