Использование паттерна Диспетчер для снижения затрат на API Claude на 95%

Разработчик, создающий ИИ-агентов, обнаружил, что тратит $40 за один час на токены API Claude для рутинных задач, таких как отладка кода, написание PR, составление писем и исследование. Он понял, что уже платит $200/месяц за Claude Max, который включает неограниченное использование Claude Code CLI в пределах лимитов скорости, и без необходимости платил за токены за работу, которую могла бы выполнить подписка.
Паттерн диспетчера
Решение — это лёгкий паттерн диспетчера, где ваш ИИ-агент выступает в качестве минимального слоя оркестрации, который делегирует тяжёлую работу в Claude Code CLI, работающему на вашей подписке Max. Диспетчер читает сообщения, решает, что делать, и делегирует задачи, такие как программирование, маркетинговые тексты, черновики писем, продажи, исследование, написание контента, анализ данных и даже посты на Reddit, в Claude Code. Только тонкий слой оркестрации остаётся на API: «Что спросил пользователь? Хорошо, делегируй в Claude Code. Сообщи результат».
Сравнение затрат
- Чистый API (Opus, интенсивное использование): $800–$2000+/месяц
- Подписка Max + паттерн диспетчера: $200/месяц фиксированно
- Затраты на API только для накладных расходов диспетчера: ~$5–15/месяц
- Итого с паттерном диспетчера: ~$215/месяц против $1000+/месяц
Инструкции по настройке
Настройка занимает около 5 минут:
# 1. Установите Claude Code CLI
npm install -g @anthropic-ai/claude-code
2. Войдите в claude code с подпиской Max
3. Настройте делегирование
openclaw config set plugins.entries.acpx.enabled true
openclaw config set plugins.entries.acpx.config.permissionMode approve-all
openclaw config set acp.enabled true
openclaw config set acp.defaultAgent claude
openclaw config set 'acp.allowedAgents' '["claude"]' --json
4. (Опционально) Добавьте наблюдаемость
pip install clawmetry && clawmetry onboard
Разработчик также создал ClawMetry, панель управления с открытым исходным кодом для агентов OpenClaw, которая отслеживает использование токенов за сессию, стоимость за задачу и позволяет устанавливать оповещения, например, «уведоми меня, если расходы на API превысят $5/день». Инструмент преодолел отметку в 100 тыс. установок и помог визуализировать резкое снижение затрат при переходе на паттерн диспетчера.
📖 Read the full source: r/openclaw
👀 Смотрите также

Оптимизация Qwen3.5-9B на RTX 3070 Mobile с помощью ik_llama.cpp: Настройки конфигурации и тесты производительности
Разработчик делится результатами оптимизации запуска модели Qwen3.5-9B Q4_K_M на ноутбуке с видеокартой RTX 3070 Mobile 8GB с использованием ik_llama.cpp, достигая скорости генерации ~50 токенов/сек и значительного улучшения оценки промптов за счёт настройки конфигурации.

Прокладывайте Claude Code через Ollama и сократите расходы на ~90%
Совместите Claude Desktop с Claude Code на базе Ollama: стратегические задачи остаются на Anthropic, тяжелые задания выполняются на бесплатных открытых моделях, таких как Gemma, Qwen, DeepSeek. Включает готовый к копированию промпт, который автоматизирует ~98% настройки.

Соединитель Todoist удален из Claude, требуется настройка вручную.
Официальный коннектор Todoist больше не доступен в Claude. Пользователи могут добавить Todoist как пользовательский коннектор, используя MCP URL https://ai.todoist.net/mcp, но для этого требуется подписка Claude Pro или Max.

12GB VRAM 基准测试:在 RTX 4070 Super 上运行 Qwen 3.6 和 Gemma 4 模型
Пользователь Reddit делится подробными бенчмарками скорости для Qwen3.6-35B-A3B, Qwen3.6-27B, Gemma 4 26B и Gemma 4 31B на 12 ГБ RTX 4070 Super с оптимизированными настройками llama.cpp.