Многомодельный совет по рабочим процессам для ИИ-агентов программирования

Разработчик создал веб-инструмент для рабочего процесса, который использует несколько моделей ИИ для проверки задач программирования перед передачей их агентам кодирования. Вместо прямого запроса к агенту инструмент реализует подход «совета», где различные модели сначала анализируют задачу.
Как работает совет
Рабочий процесс запускает три конкретные модели с различными ролями:
- Архитектор (GPT-4o): Составляет план с использованием вашей реальной кодовой базы
- Скептик (Claude): Пытается разобрать план и найти крайние случаи
- Синтезатор (Gemini): Перестраивает план в готовый для агента запрос
Детали инструмента
Пользователи вставляют свою идею и при желании загружают файлы проекта. Синтезатор создаёт файл PLAN.md с явными ограничениями «НЕ ДЕЛАЙ», извлечёнными из ваших шаблонов программирования. Разработчик отмечает, что прикрепление этого PLAN.md как @PLAN.md в интерфейсе Composer Claude заметно меняет поведение агента кодирования.
Инструмент доступен по адресу https://council-gray.vercel.app и требует от пользователей предоставления собственных API-ключей. Ничего не хранится на стороне сервера.
Разработчик создал этот инструмент после наблюдения, что некоторые люди уже вручную проводили подобные проверки с несколькими моделями в разных вкладках браузера. Они ищут отзывы о том, действительно ли этот подход улучшает результат или это излишнее усложнение рабочего процесса.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Skales: Настольный ИИ-агент с поддержкой Ollama, 300 МБ оперативной памяти в режиме простоя
Skales — это настольное приложение на Electron, которое предоставляет автономного ИИ-агента с установщиками .exe/.dmg, работает с Ollama для локального вывода или с облачными провайдерами и использует ~300 МБ оперативной памяти в режиме ожидания, храня данные локально в ~/.skales-data.

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.
Бенчмарк 4 инструментов автоматизации браузера через CLI с использованием Claude Sonnet 4.6 на 6 реальных задачах показал, что все достигли 100% точности, но openbrowser-ai использовал 36 010 токенов, в то время как другие использовали 77 123–94 130 токенов. Количество вызовов инструментов оказалось самым сильным предиктором стоимости токенов.

Пять плагинов OpenClaw, решающих ключевые проблемы производства.
Пользователь Reddit выделил пять плагинов OpenClaw, решающих распространённые проблемы в продакшене: Manifest для маршрутизации моделей, Composio для управления интеграциями, Hyperspell для памяти, Foundry для автоматизации рабочих процессов и Opik для трассировки.

Стирлинг-8B: Интерпретируемая языковая модель с атрибуцией на уровне токенов
Guide Labs выпустила Steerling-8B — языковую модель с 8 миллиардами параметров, обученную на 1,35 триллиона токенов, которая может отслеживать любой сгенерированный токен до исходного контекста, понятных человеку концепций и источников обучающих данных. Модель демонстрирует конкурентоспособную производительность по сравнению с моделями, обученными на 2–7× большем объёме данных.