콜드 검증 아키텍처: 이중 에이전트 오픈소스 코드 리뷰

콜드 검증 아키텍처는 AI 생성 코드에 대한 이중 에이전트 검증을 구현한 오픈소스 시스템입니다. 한 에이전트가 코드를 작성하는 동안, 별도의 에이전트는 작성자의 추론 과정이나 컨텍스트에 접근하지 않고 독립적으로 코드를 검토합니다.

작동 방식

이 시스템은 독립 감사와 유사한 직무 분리를 적용하여 단일 에이전트 자체 검토 편향을 해결합니다. 검토자는 작성자의 사고 과정으로부터 완전히 격리된 상태에서 작동합니다.

워크플로우 단계

계획 작성 → /review-plan (게이트 A)
구현 → /review-impl (게이트 C)
배포 → /acceptance-report (게이트 D)

주요 구현 세부사항

검토자는 격리된 임시 디렉토리에서 실행됨
검토자는 다음만 확인: 계획 문서, 코드 변경 사항, 테스트 출력
발견 사항은 추적을 위해 지문과 함께 유지됨
작성자는 검토자의 근거에 동의하지 않을 수 있음
단계당 최대 2라운드
bash 스크립트와 JSON 스키마로 구축됨
현재 Claude Code + Codex CLI와 작동
패턴은 에이전트 독립적(다른 AI 에이전트와도 작동 가능)

기술 사양

이 시스템은 두 개의 별도 AI 에이전트 간 조정을 담당하는 bash 스크립트로 구현되었습니다. JSON 스키마는 계획 문서, 코드 검토, 승인 보고서의 구조를 정의합니다. 격리된 실행 환경은 검토자가 작성자의 내부 추론 과정이나 중간 단계에 접근할 수 없도록 보장합니다.

이 접근 방식은 단일 에이전트 자체 검토가 확인 편향을 초래할 수 있는 복잡한 시스템 작업 시, AI 생성 코드에 대해 더 엄격한 검증을 구현하려는 개발자에게 유용합니다.

📖 Read the full source: r/LocalLLaMA