Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели

Пользователь Reddit две недели вручную записывал каждое взаимодействие с агентом OpenClaw, чтобы понять, на что уходят деньги. Результаты — четкий план оптимизации расходов на AI-агентов.
Разбивка
За 14 дней использования агента в Telegram + Discord использование токенов распределилось так:
- Heartbeats (опрос каждые 30 мин) — 38% использования. Запуск на Opus за ~$6.75/M токенов. Полная трата для проверки статуса.
- Чтение файлов и сводки — 29% использования. Тоже на Opus. Flash справляется идентично.
- Обычные разговоры — 22% использования. Здесь качество модели имеет значение.
- Сложные задачи — 11% использования. Где Opus действительно превосходит Flash.
В целом 67% расходов приходилось на задачи, где DeepSeek V4 Flash ($0.14/M) обеспечивает то же качество, что и Opus ($6.75/M с учетом токенизатора).
Решение: Flash по умолчанию, повышение только при необходимости
Установите основную модель как deepseek/deepseek-v4-flash в openclaw.json:
"agents": {
"defaults": {
"model": {
"primary": "deepseek/deepseek-v4-flash"
}
}
}Затем используйте /model anthropic/claude-opus-4-7 во время сессии, когда сталкиваетесь с действительно сложной задачей. Переключение мгновенное — без перезапуска, в той же сессии. Введите /model deepseek/deepseek-v4-flash, когда закончите, чтобы вернуться к дешевой модели.
Результаты
Расходы снизились с ~$170/месяц до ~$35/месяц. Разница в качестве для heartbeats, чтения файлов и простых вопросов была буквально нулевой.
Пользователь отмечает, что бесплатный тариф BetterClaw (с BYOK) теперь показывает затраты API на задачу, что сразу выявило бы траты на heartbeats. Но главный вывод — переключение основной модели на Flash и повышение до Opus только при необходимости — вот что действительно важно.
📖 Read the full source: r/openclaw
👀 Смотрите также

Параллельные агенты аудита: практический подход к тестированию на основе вибрации с помощью Claude
Разработчик создал систему пользовательского тестирования с помощью Claude, используя 10 параллельных агентов аудита, охватывающих обнаружение галлюцинаций, страж API, стресс-тестирование UI, анонимизацию PII, SEO, юридическое соответствие, поведенческое моделирование, демографические персоны, воронкообразное тестирование и проверку фактов.

Формулирование диалогов с ИИ вместо написания идеальных запросов
Разработчик делится семью практическими техниками для улучшения ответов Claude AI, фокусируясь на контексте, ролях, последствиях и запросах на оценку, а не на идеальной формулировке промптов.

«Режим отказа „Белая обезьяна“: как настойчивые агенты застревают на неверных фактах»
Межархитектурное исследование «загрязнения субстрата реконструкции» — когда ложные факты из файлов состояния бодрствования реплицируются между сессиями. Включает опрос из 6 вопросов для постоянных агентов.

Синхронизация iCloud Desktop/Documents вызывает проблемы с потерей файлов в Claude на Mac
Пользователь Mac сообщает, что включение синхронизации iCloud Drive для папок «Рабочий стол» и «Документы» приводит к созданию Claude дубликатов файлов и может вызвать безвозвратную потерю данных, включая скрытые папки /.claude, которые iCloud не резервирует.