Как я сократил расходы на OpenClaw на 60% с помощью маршрутизации моделей

✍️ OpenClawRadar📅 Опубликовано: 16 марта 2026 г.🔗 Source

Разбивка затрат и анализ

Пользователь OpenClaw, запустивший четыре агента для аналитики данных сайта, контента блога, проверки кода и поддержки клиентов, обнаружил, что тратил $420 за 20 дней ($21/день). Все агенты были настроены на использование исключительно Claude Opus по цене $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов.

После регистрации 13 500 вызовов по всем агентам за 20 дней они классифицировали задачи по сложности:

70% были простыми задачами: ответы на FAQ, базовое форматирование, однострочные сводки, обобщение незначительных PR
16% были стандартными задачами: составление длинных черновиков писем, умеренная проверка кода, многоабзацные сводки
9% были сложными задачами: глубокий анализ кода, длинный контент, контекст с несколькими файлами
6% требовали реального рассуждения: архитектурные решения, сложная отладка, многошаговая логика

Анализ показал, что они платили премиальные цены Opus за 70% задач, с которыми более дешёвые модели справились бы без потери качества.

Сравнение цен моделей

Пользователь изучил текущие цены моделей:

Claude Opus 4.6: $5.00 вход/$25.00 выход за 1 млн токенов (премиум)
Claude Sonnet 4.6: $3.00 вход/$15.00 выход за 1 млн токенов (средний уровень)
Claude Haiku 4.5: $1.00 вход/$5.00 выход за 200 тыс. токенов (бюджет)
GPT-5.4: $2.50 вход/$15.00 выход за 1.05 млн токенов (премиум)
Gemini 3.1 Pro: $2.00 вход/$12.00 выход за 1 млн токенов (средний уровень)
Gemini 3 Flash: $0.50 вход/$3.00 выход за 1 млн токенов (бюджет)
GLM-5: $0.72–1.00 вход/$2.30–3.20 выход за 200 тыс. токенов (бюджет)
Kimi K2.5: $0.60 вход/$3.00 выход за 256 тыс. токенов (бюджет)
MiniMax M2.5: $0.30 вход/$1.20 выход за 1 млн токенов (ультрабюджет)

Реализация и результаты

Теперь они запускают Opus только для действительно сложных задач. Всё остальное направляется в Sonnet, Haiku, Kimi K2.5 или Qwen. Переход занял около недели, чтобы найти подходящие модели для каждого типа задач.

Ключевые выводы из тестирования:

Claude Haiku был самым надёжным для поддержки клиентов: быстрые ответы, хорошо следовал инструкциям по форматированию, сохранял ответы краткими
Haiku требует явных промптов — он не выводит тон или стиль из расплывчатых инструкций, как это делает Opus
Переписывание системных промптов с чётким указанием структуры ответов сделало Haiku надёжным для поддержки
Kimi K2.5 дешевле и хорошо справляется с длинным контекстом для многоходовых диалогов

Пользователи не заметили разницы в простых задачах, а затраты снизились с $420 до $168 за 20 дней.

📖 Read the full source: r/openclaw

👀 Смотрите также

Кейсы

Эффективность исправления ошибок в Claude Haiku 4.5 сильно зависит от качества промпта, показывают пользовательские тесты.

Тестирование с участием 380 пользователей на реальных производственных ошибках показывает, что Claude Haiku 4.5 может эффективно исправлять ошибки при наличии надлежащего контекста, но результаты значительно различаются в зависимости от того, насколько хорошо пользователи описывают проблему.

9 мар. 2026 г., 05:45 UTC

OpenClawRadar

🦀

Кейсы

Клод Код написал каждую строку видео запуска 50-х годов в Remotion — но на это ушло ~100 запросов

Разработчик подробно рассказывает, как использовал Claude Code для генерации каждой строки TypeScript/TSX для рекламного видео Remotion. Процесс потребовал ~100 промптов, подробного креативного брифа, итераций по сценам и частых git diff.

12 мая 2026 г., 20:16 UTC

OpenClawRadar

Кейсы

Claude Word Add-in: Параллельная обработка юридических документов объемом более 100 страниц и многостраничных электронных таблиц

Пользователи сообщают о синхронизации нескольких юридических документов объемом 40–100+ страниц и электронных таблиц с 10 листами параллельно через надстройку Claude Word, при этом агенты отправляют/получают данные и обеспечивают согласованность во всем пакете документов.

30 апр. 2026 г., 06:15 UTC

OpenClawRadar

Кейсы

Локализация больших кодовых баз с помощью LLM: Рабочий процесс разработчика для 4500 UI-ключей

Разработчик делится своим рабочим процессом локализации игры с 4500 ключами интерфейса с использованием LLM. Он обнаружил, что добавление контекста к промптам перевода и использование локальных моделей, таких как Qwen 3 8B, даёт приемлемое качество, в то время как облачные модели, такие как Claude и Gemini Pro, испытывали трудности с размером файлов и точностью.

2 мар. 2026 г., 00:45 UTC

OpenClawRadar