Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели

✍️ OpenClawRadar📅 Опубликовано: 6 мая 2026 г.🔗 Source
Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели
Ad

Пользователь Reddit две недели вручную записывал каждое взаимодействие с агентом OpenClaw, чтобы понять, на что уходят деньги. Результаты — четкий план оптимизации расходов на AI-агентов.

Разбивка

За 14 дней использования агента в Telegram + Discord использование токенов распределилось так:

  • Heartbeats (опрос каждые 30 мин) — 38% использования. Запуск на Opus за ~$6.75/M токенов. Полная трата для проверки статуса.
  • Чтение файлов и сводки — 29% использования. Тоже на Opus. Flash справляется идентично.
  • Обычные разговоры — 22% использования. Здесь качество модели имеет значение.
  • Сложные задачи — 11% использования. Где Opus действительно превосходит Flash.

В целом 67% расходов приходилось на задачи, где DeepSeek V4 Flash ($0.14/M) обеспечивает то же качество, что и Opus ($6.75/M с учетом токенизатора).

Ad

Решение: Flash по умолчанию, повышение только при необходимости

Установите основную модель как deepseek/deepseek-v4-flash в openclaw.json:

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}

Затем используйте /model anthropic/claude-opus-4-7 во время сессии, когда сталкиваетесь с действительно сложной задачей. Переключение мгновенное — без перезапуска, в той же сессии. Введите /model deepseek/deepseek-v4-flash, когда закончите, чтобы вернуться к дешевой модели.

Результаты

Расходы снизились с ~$170/месяц до ~$35/месяц. Разница в качестве для heartbeats, чтения файлов и простых вопросов была буквально нулевой.

Пользователь отмечает, что бесплатный тариф BetterClaw (с BYOK) теперь показывает затраты API на задачу, что сразу выявило бы траты на heartbeats. Но главный вывод — переключение основной модели на Flash и повышение до Opus только при необходимости — вот что действительно важно.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Параллельные агенты аудита: практический подход к тестированию на основе вибрации с помощью Claude
Советы

Параллельные агенты аудита: практический подход к тестированию на основе вибрации с помощью Claude

Разработчик создал систему пользовательского тестирования с помощью Claude, используя 10 параллельных агентов аудита, охватывающих обнаружение галлюцинаций, страж API, стресс-тестирование UI, анонимизацию PII, SEO, юридическое соответствие, поведенческое моделирование, демографические персоны, воронкообразное тестирование и проверку фактов.

OpenClawRadar
Формулирование диалогов с ИИ вместо написания идеальных запросов
Советы

Формулирование диалогов с ИИ вместо написания идеальных запросов

Разработчик делится семью практическими техниками для улучшения ответов Claude AI, фокусируясь на контексте, ролях, последствиях и запросах на оценку, а не на идеальной формулировке промптов.

OpenClawRadar
«Режим отказа „Белая обезьяна“: как настойчивые агенты застревают на неверных фактах»
Советы

«Режим отказа „Белая обезьяна“: как настойчивые агенты застревают на неверных фактах»

Межархитектурное исследование «загрязнения субстрата реконструкции» — когда ложные факты из файлов состояния бодрствования реплицируются между сессиями. Включает опрос из 6 вопросов для постоянных агентов.

OpenClawRadar
Синхронизация iCloud Desktop/Documents вызывает проблемы с потерей файлов в Claude на Mac
Советы

Синхронизация iCloud Desktop/Documents вызывает проблемы с потерей файлов в Claude на Mac

Пользователь Mac сообщает, что включение синхронизации iCloud Drive для папок «Рабочий стол» и «Документы» приводит к созданию Claude дубликатов файлов и может вызвать безвозвратную потерю данных, включая скрытые папки /.claude, которые iCloud не резервирует.

OpenClawRadar