Dual-Agent Code-Review-System: Open Source Kaltvalidierung

Cold Validation Architecture ist ein Open-Source-System, das eine Dual-Agent-Validierung für KI-generierten Code implementiert. Ein Agent schreibt den Code, während ein separater Agent ihn unabhängig prüft, ohne Zugriff auf die Überlegungen oder den Kontext des Erstellers zu haben.

Wie es funktioniert

Das System adressiert die Selbstprüfungsverzerrung bei Einzelagenten durch die Anwendung einer Aufgabentrennung ähnlich unabhängiger Audits. Der Prüfer arbeitet in vollständiger Isolation vom Denkprozess des Erstellers.

Arbeitsablaufphasen

Plan schreiben → /review-plan (Gate A)
Implementieren → /review-impl (Gate C)
Ausliefern → /acceptance-report (Gate D)

Wichtige Implementierungsdetails

Der Prüfer läuft in einem isolierten temporären Verzeichnis
Prüfer sieht nur: Plan-Dokument, Code-Diff und Testergebnis
Ergebnisse bleiben mit Fingerabdrücken zur Nachverfolgung erhalten
Ersteller kann der Begründung des Prüfers widersprechen
Maximal 2 Runden pro Phase
Erstellt mit Bash-Skripten und JSON-Schemata
Funktioniert derzeit mit Claude Code + Codex CLI
Muster ist agentenunabhängig (funktioniert mit verschiedenen KI-Agenten)

Technische Spezifikationen

Das System ist als Bash-Skripte implementiert, die zwischen zwei separaten KI-Agenten koordinieren. JSON-Schemata definieren die Struktur für Plan-Dokumente, Code-Überprüfungen und Abnahmeprotokolle. Die isolierte Ausführungsumgebung stellt sicher, dass der Prüfer keinen Zugriff auf die internen Überlegungen oder Zwischenschritte des Erstellers hat.

Dieser Ansatz ist nützlich für Entwickler, die eine strengere Validierung für KI-generierten Code implementieren möchten, insbesondere bei der Arbeit mit komplexen Systemen, bei denen die Selbstprüfung durch einen einzelnen Agenten Bestätigungsverzerrungen einführen könnte.

📖 Read the full source: r/LocalLLaMA

Kaltvalidierungsarchitektur: Dual-Agent-Code-Review-System als Open Source veröffentlicht

Wie es funktioniert

Arbeitsablaufphasen

Wichtige Implementierungsdetails

Technische Spezifikationen

👀 Siehe auch

OpenClaw vs Hermes: Unterschiedliche Designphilosophien für KI-Agenten

Wrangle: Ein nativer macOS-Editor zur Verwaltung von Claude-Code-Sitzungen

Knowledge Raven: Ein durchsuchbares Wissensdatenbank-Plugin für Claude

Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren