ClawCodex /режим советника: Объедините дешевого работника с дорогим рецензентом, чтобы сократить расходы без потери качества

Большинство CLI-агентов заставляют выбирать одну модель: Opus принимает отличные решения, но сжигает бюджет, а Haiku дёшев, но упускает критически важные архитектурные моменты. ClawCodex, открытый Python-порт Claude Code, решает эту проблему с помощью режима /advisor, который на ключевых этапах принятия решений сочетает дешёвую рабочую модель с дорогой рецензирующей моделью.
Как это работает
Дешёвая рабочая модель (например, haiku-4-5, deepseek-v4-pro) выполняет основную работу — чтение файлов, редактирование, запуск тестов. На этапах принятия решений — перед фиксацией интерпретации, перед объявлением задачи выполненной или при возникновении затруднений — рабочая модель приостанавливается и обращается за советом к более сильной рецензирующей модели (например, opus-4-7). Рецензент просматривает весь диалог (каждый вызов инструмента, каждый результат) и возвращает краткую подсказку в формате Пробелы / Риски / Что делать дальше. Затем рабочая модель продолжает работу.
Два режима выполнения
- Серверный (Anthropic 1P): Использует бета-заголовок советника — один раунд, дружественный к кэшированию промптов. И рабочая, и рецензирующая модели работают на стороне Anthropic.
- Клиентский (любой провайдер): Рабочая модель генерирует обычный вызов
tool_use, агент перехватывает его и выполняет отдельный вызов к настроенной рецензирующей модели. Два раунда, но можно комбинировать провайдеров — например, рабочая модель DeepSeek + рецензент Claude Opus, или рабочая модель Gemini + рецензент GLM.
Настройка и мониторинг
Настройка выполняется одной строкой в REPL:
/advisor anthropic:claude-opus-4-7
/advisor deepseek:deepseek-v4-pro
Строка состояния показывает токены рабочей модели, токены рецензента и стоимость в USD отдельно, так что вы точно видите, на что уходят средства.
Бенчмарки и совместимость
ClawCodex изначально поддерживает Anthropic, OpenAI, Gemini, DeepSeek, GLM, Minimax и OpenRouter. На SWE-bench Verified агент набирает 58,2% с Gemini 2.5 Pro против 53% у OpenClaude в тех же условиях.
Сложнее всего: промпты
Самая сложная инженерная задача заключалась в том, чтобы рецензент не просто повторял план рабочей модели — ранние версии тратили контекст на дословные повторы. Решением стало строгое правило «никаких местоимений первого лица, никаких повторений» в сочетании с шаблоном Пробелы / Риски / Что делать дальше.
Для кого это
Для разработчиков, использующих ИИ-агенты кодирования, которые хотят получать архитектурные решения уровня Opus, не платя по тарифам Opus за каждый вызов.
📖 Читать полный исходник: r/openclaw
👀 Смотрите также

Разработчик достиг задержки менее секунды для STT/TTS с локальными серверами Whisper и Coqui-TTS.
Разработчик опубликовал в открытом доступе реализации локальных серверов для Whisper STT и Coqui TTS, которые обеспечивают задержку ~0,2 секунды при преобразовании речи в текст и ~250 мс при преобразовании текста в речь, что позволяет создавать разговорные ИИ-агенты без зависимости от облачных сервисов.

Ежемесячный план Alibaba стоимостью $10 предоставляет пользователям OpenClaw расширенный доступ к множеству ИИ-моделей.
За 10 долларов в месяц план от Alibaba предоставляет доступ к моделям Qwen3.5-Plus, Kimi-K2.5, GLM-5 и MiniMax-M2.5 с квотами в 1200 запросов за 5 часов, 9000 в неделю и 18 000 в месяц.

Fehu: CLI-бухгалтерия двойной записи с интеграцией Claude AI MCP
Fehu — это легковесный CLI-инструмент для личного учёта, который подключается к Claude AI через MCP, позволяя записывать транзакции на естественном языке с использованием двойной бухгалтерии на основе SQLite. Он поддерживает иерархические счета, автоматическое тегирование хештегами, мощный движок вычислений и работу с несколькими валютами.

Плагин OpenClaw A2A: Прямой обмен сообщениями между агентами через Интернет
Плагин OpenClaw A2A обеспечивает прямую передачу файлов и сообщений между OpenClaw и другими агентами через интернет без сторонних сервисов, таких как WhatsApp или электронная почта.