AI 코딩 에이전트 교차 모델 검토 루프: 치명적 계획 결함 포착

교차 모델 검토의 작동 방식

r/ClaudeAI의 한 개발자가 Codex, Claude Code, Cursor와 같은 AI 코딩 에이전트의 일반적인 문제를 해결하는 시스템을 구축했습니다: 계획이 가정에 대한 검증 없이 실행되는 문제입니다. 이 솔루션은 실행 시작 전 모든 계획을 다른 아키텍처와 학습 데이터를 가진 두 번째 AI 모델을 통해 검토하도록 합니다.

주요 구현 세부사항

검토자 모델은 읽기 전용이며 코드를 수정할 수 없습니다—계획에 대해 이의를 제기하는 것만 가능합니다. 이 제약은 "편집이 가능해지는 순간 비판자가 아닌 타협자가 되기 시작하기 때문에" 매우 중요합니다. 시스템은 라운드 제한이 있는 자동 루프를 실행합니다: 문제가 발견되면 계획은 통과하거나 제한에 도달할 때까지 수정을 위해 반환됩니다.

시스템이 포착하는 내용

실제로 롤백하지 않는 롤백 계획
실제 보안 허점이 있는 권한 설계
오래된 상태에서 진행/중단 결정을 내리는 검토 게이트
두 번째 모델이 전체 흐름을 따라가기 전까지는 일관성 있게 들리는 다단계 계획

중요한 설계 결정

범위가 지정된 검토 컨텍스트는 검토자가 저장소의 관련 없는 부분을 읽는 데 시간을 낭비하는 것을 방지합니다
검토자 페르소나(배포 위험, 재현성, 성능 비용, 안전 규정 준수)는 다양한 유형의 문제를 포착합니다
실시간 TUI 대시보드는 단일 터미널 뷰에서 단계, 라운드, 판정, 심각도, 비용 및 기록을 보여줍니다
시스템은 다양한 플래너와 함께 작동합니다: Claude Code는 기본 ExitPlanMode 훅을 사용하는 반면 Codex 및 다른 오케스트레이터는 명시적 게이트를 사용합니다

실질적 결과

개발자는 이 시스템을 사용하여 시스템 자체를 구축하는 데 도움을 받았습니다: "Codex가 계획을 세우고, Claude가 계획을 검토했으며, 설계는 여러 라운드에 걸쳐 수렴되었습니다." 이 도구는 MIT 라이선스로 배포되며 GitHub에서 rival-review로 이용 가능합니다.

📖 Read the full source: r/ClaudeAI