AI 코딩 에이전트를 위한 교차 모델 검토 루프가 치명적인 계획 결함을 포착합니다

교차 모델 검토의 작동 방식
r/ClaudeAI의 한 개발자가 Codex, Claude Code, Cursor와 같은 AI 코딩 에이전트의 일반적인 문제를 해결하는 시스템을 구축했습니다: 계획이 가정에 대한 검증 없이 실행되는 문제입니다. 이 솔루션은 실행 시작 전 모든 계획을 다른 아키텍처와 학습 데이터를 가진 두 번째 AI 모델을 통해 검토하도록 합니다.
주요 구현 세부사항
검토자 모델은 읽기 전용이며 코드를 수정할 수 없습니다—계획에 대해 이의를 제기하는 것만 가능합니다. 이 제약은 "편집이 가능해지는 순간 비판자가 아닌 타협자가 되기 시작하기 때문에" 매우 중요합니다. 시스템은 라운드 제한이 있는 자동 루프를 실행합니다: 문제가 발견되면 계획은 통과하거나 제한에 도달할 때까지 수정을 위해 반환됩니다.
시스템이 포착하는 내용
- 실제로 롤백하지 않는 롤백 계획
- 실제 보안 허점이 있는 권한 설계
- 오래된 상태에서 진행/중단 결정을 내리는 검토 게이트
- 두 번째 모델이 전체 흐름을 따라가기 전까지는 일관성 있게 들리는 다단계 계획
중요한 설계 결정
- 범위가 지정된 검토 컨텍스트는 검토자가 저장소의 관련 없는 부분을 읽는 데 시간을 낭비하는 것을 방지합니다
- 검토자 페르소나(배포 위험, 재현성, 성능 비용, 안전 규정 준수)는 다양한 유형의 문제를 포착합니다
- 실시간 TUI 대시보드는 단일 터미널 뷰에서 단계, 라운드, 판정, 심각도, 비용 및 기록을 보여줍니다
- 시스템은 다양한 플래너와 함께 작동합니다: Claude Code는 기본 ExitPlanMode 훅을 사용하는 반면 Codex 및 다른 오케스트레이터는 명시적 게이트를 사용합니다
실질적 결과
개발자는 이 시스템을 사용하여 시스템 자체를 구축하는 데 도움을 받았습니다: "Codex가 계획을 세우고, Claude가 계획을 검토했으며, 설계는 여러 라운드에 걸쳐 수렴되었습니다." 이 도구는 MIT 라이선스로 배포되며 GitHub에서 rival-review로 이용 가능합니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

AI 에이전트 보안 및 최적화를 위한 두 가지 새로운 오픈 소스 도구
AI 에이전트 개발자를 위한 두 가지 오픈 소스 도구가 제공됩니다: AI Agent Defense Kit는 런타임 보안 기술을 제공하고, AgentGuard(개발 중)는 비용 추적, 보안 스캐닝 및 활동 모니터링 기능을 제공합니다.

Termrender: 클로드를 위한 6배 토큰 효율적인 ASCII UI 시각화
Termrender는 원시 Claude 출력에 비해 6배의 토큰 효율성을 제공하는 ASCII UI 시각화를 생성하는 오픈소스 Python 도구입니다. 이는 빠른 생성과 편집을 위해 최소한의 토큰을 사용하여 다이어그램과 패널을 생성합니다.

SuperContext: AI 코딩 에이전트를 위한 영구 메모리 프레임워크
SuperContext는 대규모 지침 문서 대신 구조화된 대상 파일을 통해 Claude와 같은 AI 코딩 도구에 지속적인 메모리를 제공하는 오픈소스 프레임워크입니다. 수동 설정 없이 약 10분 만에 시스템을 구축하는 실행 가능한 프롬프트를 포함하고 있습니다.

그래피파이: 리포지토리의 지식 그래프를 구축한 클로드 코드 스킬 — 26일 만에 45만 다운로드, 4만 별
Graphify는 저장소의 모든 파일을 읽고 Leiden 커뮤니티 탐지로 지식 그래프를 구축한 후, 원시 파일보다 71배 적은 토큰으로 쿼리하는 Claude Code 스킬입니다. PyPI 다운로드 450k+회, GitHub 스타 약 40k개, 첫 주 글로벌 랭킹 2위.