Кросс-модельное ревью AI-агентов: выявление критических недостатков

Как работает кросс-модельное ревью

Разработчик на r/ClaudeAI создал систему, которая решает распространённую проблему с ИИ-агентами для программирования, такими как Codex, Claude Code и Cursor: планы выполняются без предварительной проверки их предположений. Решение направляет каждый план через вторую модель ИИ с другой архитектурой и обучающими данными до начала выполнения.

Ключевые детали реализации

Модель-рецензент работает в режиме только для чтения и не может изменять код — она может только оспаривать план. Это ограничение критически важно, потому что «как только она сможет редактировать, она перестаёт быть критиком и начинает идти на компромиссы». Система запускает автоматический цикл с ограничением по раундам: планы возвращаются на доработку, если обнаружены проблемы, пока они не пройдут проверку или не достигнут лимита.

Что система выявляет

Планы отката, которые фактически не откатывают изменения
Схемы разрешений с реальными уязвимостями безопасности
Контрольные точки ревью, принимающие решения о продолжении/остановке на основе устаревших данных
Многоэтапные планы, которые кажутся логичными, пока вторая модель не пройдёт по всему процессу

Критические проектные решения

Ограниченный контекст ревью предотвращает трату времени рецензента на чтение нерелевантных частей репозитория
Персоны рецензента (риски поставки, воспроизводимость, производительность-стоимость, безопасность-соответствие) выявляют разные типы проблем
Живая TUI-панель управления показывает фазу, раунд, вердикт, серьёзность, стоимость и историю в одном терминальном представлении
Система работает с разными планировщиками: Claude Code использует нативный хук ExitPlanMode, а Codex и другие оркестраторы используют явный шлюз

Практические результаты

Разработчик использовал систему, чтобы помочь построить её саму: «Codex планировал, Claude рецензировал планы, и дизайн сходился за несколько раундов». Инструмент имеет лицензию MIT и доступен как rival-review на GitHub.

📖 Read the full source: r/ClaudeAI