Маршрутизация трафика API Claude для контроля затрат после изменения подписки Max

Переход на API-биллинг и финансовые последствия
С полудня по тихоокеанскому времени подписка Anthropic Max больше не покрывает использование сторонних инструментов, таких как OpenClaw. Все пользователи OpenClaw теперь переведены на API-биллинг со следующими тарифами:
- Claude Opus 4.6: $5 за миллион входных токенов, $25 за миллион выходных токенов
- Claude Sonnet 4.6: $3 за миллион входных токенов, $15 за миллион выходных токенов
- Claude Haiku 4.5: $1 за миллион входных токенов, $5 за миллион выходных токенов
Интенсивная сессия OpenClaw на Opus может стоить $1-4, тогда как та же сессия на Sonnet обходится в $0.20-0.80 с аналогичными результатами для большинства задач.
Решение по маршрутизации
Большинству операций OpenClaw не требуется Opus: проверки активности, чтение файлов, составление сводок, решения по маршрутизации и короткие вызовы инструментов могут обрабатываться Sonnet. Без слоя маршрутизации каждый запрос попадает к вашей модели по умолчанию, потенциально расходуя бюджет Opus на простые задачи.
Локальный прокси маршрутизирует запросы к Claude по сложности: простые задачи автоматически направляются к Sonnet, сложные передаются Opus. Этот подход значительно сократил затраты без потери качества на важных задачах.
Прокси имеет открытый исходный код и устанавливается через npm: npm install -g @relayplane/proxy
Подробная документация и обсуждение доступны на r/ClaudeCode, где это решение набрало 52 тыс. просмотров.
📖 Read the full source: r/openclaw
👀 Смотрите также

Марми: Самостоятельно размещаемое мобильное приложение для управления несколькими сессиями ИИ-агентов программирования
Marmy — это инструмент с открытым исходным кодом и возможностью самостоятельного хостинга, созданный на основе Claude Code, который позволяет управлять несколькими сессиями ИИ-агентов для программирования прямо с телефона. Он включает в себя агент на Rust для ваших машин, приложение для iOS, просмотр файлов с подсветкой синтаксиса, push-уведомления и архитектуру «менеджер-агент».

Обходимый граф навыков для постоянной памяти ИИ-агента в кодовых базах
Разработчик создал трехслойную систему графа навыков, которая существует внутри кодовой базы, позволяя ИИ-ассистентам для программирования сохранять постоянную память между сессиями. Система использует прогрессивное раскрытие информации с самонаправляющими инструкциями вместо монолитных контекстных файлов.

ClawHost Open-Source OpenClaw с развертыванием в один клик набирает более 200 звёзд на GitHub
ClawHost, инструмент с открытым исходным кодом для установки OpenClaw в один клик с полным доступом к серверу и контролем, достиг отметки в 200+ звёзд на GitHub. Проект решает проблемы с нестабильными коммерческими обёртками, предоставляя бесплатное, самостоятельно размещаемое решение.

Открытый MCP-сервер позволяет ИИ-агентам обрабатывать платежи L402 через сеть Lightning.
Плагин MCP для Python, созданный с помощью FastMCP, перехватывает HTTP-ответы 402 Payment Required, оплачивает счета Lightning Network и получает данные для ИИ-агентов. Репозиторий включает локальный тестовый агент для проверки без траты реальных средств.