콜드 검증 아키텍처: 이중 에이전트 코드 리뷰 시스템 오픈소스 공개

콜드 검증 아키텍처는 AI 생성 코드에 대한 이중 에이전트 검증을 구현한 오픈소스 시스템입니다. 한 에이전트가 코드를 작성하는 동안, 별도의 에이전트는 작성자의 추론 과정이나 컨텍스트에 접근하지 않고 독립적으로 코드를 검토합니다.
작동 방식
이 시스템은 독립 감사와 유사한 직무 분리를 적용하여 단일 에이전트 자체 검토 편향을 해결합니다. 검토자는 작성자의 사고 과정으로부터 완전히 격리된 상태에서 작동합니다.
워크플로우 단계
- 계획 작성 →
/review-plan(게이트 A) - 구현 →
/review-impl(게이트 C) - 배포 →
/acceptance-report(게이트 D)
주요 구현 세부사항
- 검토자는 격리된 임시 디렉토리에서 실행됨
- 검토자는 다음만 확인: 계획 문서, 코드 변경 사항, 테스트 출력
- 발견 사항은 추적을 위해 지문과 함께 유지됨
- 작성자는 검토자의 근거에 동의하지 않을 수 있음
- 단계당 최대 2라운드
- bash 스크립트와 JSON 스키마로 구축됨
- 현재 Claude Code + Codex CLI와 작동
- 패턴은 에이전트 독립적(다른 AI 에이전트와도 작동 가능)
기술 사양
이 시스템은 두 개의 별도 AI 에이전트 간 조정을 담당하는 bash 스크립트로 구현되었습니다. JSON 스키마는 계획 문서, 코드 검토, 승인 보고서의 구조를 정의합니다. 격리된 실행 환경은 검토자가 작성자의 내부 추론 과정이나 중간 단계에 접근할 수 없도록 보장합니다.
이 접근 방식은 단일 에이전트 자체 검토가 확인 편향을 초래할 수 있는 복잡한 시스템 작업 시, AI 생성 코드에 대해 더 엄격한 검증을 구현하려는 개발자에게 유용합니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Obsidian 통합을 통한 OpenClaw와 Claude Code의 지속적 메모리
레딧 사용자가 OpenClaw와 Claude Code를 Obsidian 볼트에 연결하면 세션 간 지속적인 장기 기억이 생성되는 방법을 시연합니다. 이 설정은 기억, 맥락, 프로젝트 파일, 노트를 자동으로 연결하며, 모든 인스턴스는 필요할 때 공유 메모리에 접근할 수 있습니다.

mycrab.space는 표준화된 앱 배포를 위해 SKILL.md와 Prompt Autocomposer를 소개합니다.
mycrab.space는 SKILL.md를 출시했습니다. 이는 앱 종속성과 구성을 정의하는 마크다운 청사진이며, 이러한 파일에서 바로 사용할 수 있는 배포 명령을 생성하는 프롬프트 자동 작성기입니다. 이 시스템은 브라우저 내 VS Code, 개인 음악 클라우드, AI 에이전트 인터페이스와 같은 애플리케이션을 제로 설정으로 배포할 수 있게 합니다.

operate.txt 소개: SaaS 제품 탐색을 위한 AI 에이전트용 YAML 사양
개발자가 operate.txt를 만들었습니다. 이는 AI 에이전트가 컴퓨터 사용 기능을 활용할 때 화면 세부사항, 로딩 상태, 되돌릴 수 없는 작업, 단계별 경로를 문서화하는 yourdomain.com/operate.txt에 호스팅된 YAML 파일입니다. 이 사양은 Claude가 정상적인 로딩 화면에서 '이거 고장난 거야?'라고 묻는 문제를 해결합니다.

GrapeRoot Pro, 클로드 코드가 프로젝트를 삭제하는 것을 방지하는 Undo Shield 추가
Reddit에서 Claude Code가 전체 프로젝트를 삭제했다는 보고가 잇따르자, GrapeRoot Pro는 Claude의 세션 그래프를 모니터링하고 rm -rf 같은 파괴적 명령을 차단하는 Undo Shield를 출시했습니다.