Как я сократил расходы на OpenClaw на 60% с помощью маршрутизации моделей

Разбивка затрат и анализ
Пользователь OpenClaw, запустивший четыре агента для аналитики данных сайта, контента блога, проверки кода и поддержки клиентов, обнаружил, что тратил $420 за 20 дней ($21/день). Все агенты были настроены на использование исключительно Claude Opus по цене $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов.
После регистрации 13 500 вызовов по всем агентам за 20 дней они классифицировали задачи по сложности:
- 70% были простыми задачами: ответы на FAQ, базовое форматирование, однострочные сводки, обобщение незначительных PR
- 16% были стандартными задачами: составление длинных черновиков писем, умеренная проверка кода, многоабзацные сводки
- 9% были сложными задачами: глубокий анализ кода, длинный контент, контекст с несколькими файлами
- 6% требовали реального рассуждения: архитектурные решения, сложная отладка, многошаговая логика
Анализ показал, что они платили премиальные цены Opus за 70% задач, с которыми более дешёвые модели справились бы без потери качества.
Сравнение цен моделей
Пользователь изучил текущие цены моделей:
- Claude Opus 4.6: $5.00 вход/$25.00 выход за 1 млн токенов (премиум)
- Claude Sonnet 4.6: $3.00 вход/$15.00 выход за 1 млн токенов (средний уровень)
- Claude Haiku 4.5: $1.00 вход/$5.00 выход за 200 тыс. токенов (бюджет)
- GPT-5.4: $2.50 вход/$15.00 выход за 1.05 млн токенов (премиум)
- Gemini 3.1 Pro: $2.00 вход/$12.00 выход за 1 млн токенов (средний уровень)
- Gemini 3 Flash: $0.50 вход/$3.00 выход за 1 млн токенов (бюджет)
- GLM-5: $0.72–1.00 вход/$2.30–3.20 выход за 200 тыс. токенов (бюджет)
- Kimi K2.5: $0.60 вход/$3.00 выход за 256 тыс. токенов (бюджет)
- MiniMax M2.5: $0.30 вход/$1.20 выход за 1 млн токенов (ультрабюджет)
Реализация и результаты
Теперь они запускают Opus только для действительно сложных задач. Всё остальное направляется в Sonnet, Haiku, Kimi K2.5 или Qwen. Переход занял около недели, чтобы найти подходящие модели для каждого типа задач.
Ключевые выводы из тестирования:
- Claude Haiku был самым надёжным для поддержки клиентов: быстрые ответы, хорошо следовал инструкциям по форматированию, сохранял ответы краткими
- Haiku требует явных промптов — он не выводит тон или стиль из расплывчатых инструкций, как это делает Opus
- Переписывание системных промптов с чётким указанием структуры ответов сделало Haiku надёжным для поддержки
- Kimi K2.5 дешевле и хорошо справляется с длинным контекстом для многоходовых диалогов
Пользователи не заметили разницы в простых задачах, а затраты снизились с $420 до $168 за 20 дней.
📖 Read the full source: r/openclaw
👀 Смотрите также

Сокращение избыточности контекста ИИ-агентов с помощью архитектуры единого рабочего пространства
Разработчик рассказывает, как сократил начальный контекст ИИ-ассистента с 27 000 до 4 000 токенов, внедрив подход с единым рабочим пространством вместо сложных роев агентов, используя инъекцию идентичности на уровне каналов и изолированные папки памяти.

Создание Концертного Радара с OpenClaw: Сбор информации о выступлениях артистов из нескольких источников
Разработчик создал радар концертов с помощью OpenClaw на VPS, который получает артистов из Spotify, ежедневно сканирует несколько источников, нормализует события, сопоставляет артистов, удаляет дубликаты и отслеживает новые анонсы через cron-задачи.

Партнерская программа Claude: консалтинг из двух человек решает задачу для десяти с помощью сертифицированных независимых специалистов
Консалтинговая компания в сфере ИИ из двух человек использовала Claude, чтобы попасть в партнёрскую программу Anthropic, а затем привлекла сертифицированных независимых специалистов для соблюдения требования о 10 сотрудниках.

Пользователь OpenClaw развивает навыки суммирования банковских выписок и отчетов по кредитным картам.
Новый пользователь OpenClaw самостоятельно разместил инструмент на защищённом сервере и использовал его для разработки двух пользовательских навыков: один для обобщения и категоризации банковских выписок, а другой — для обобщения выписок по кредитным картам с категоризацией и обнаружением разрывов. Навыки автоматически генерируют отчёты при появлении новых выписок и отправляют уведомления в Telegram.