コールドバリデーションアーキテクチャ:デュアルエージェントコードレビューシステムをオープンソース化

Cold Validation Architectureは、AI生成コードのためのデュアルエージェント検証を実装するオープンソースシステムです。1つのエージェントがコードを記述し、別の独立したエージェントが構築者の推論や文脈にアクセスせずにレビューを行います。
仕組み
このシステムは、独立監査と同様の職務分離を適用することで、単一エージェントの自己レビューによるバイアスに対処します。レビュアーは構築者の思考プロセスから完全に隔離された状態で動作します。
ワークフローの段階
- 計画作成 →
/review-plan(ゲートA) - 実装 →
/review-impl(ゲートC) - 出荷 →
/acceptance-report(ゲートD)
主要な実装詳細
- レビュアーは隔離された一時ディレクトリで実行される
- レビュアーが参照するのは:計画文書、コード差分、テスト出力のみ
- 発見事項は追跡用のフィンガープリントと共に保持される
- 構築者はレビュアーの論理に異議を唱えることができる
- 各段階で最大2ラウンドまで
- bashスクリプトとJSONスキーマで構築
- 現在はClaude Code + Codex CLIで動作
- パターンはエージェント非依存(異なるAIエージェントでも動作可能)
技術仕様
このシステムは、2つの独立したAIエージェント間を調整するbashスクリプトとして実装されています。JSONスキーマは、計画文書、コードレビュー、受入報告書の構造を定義します。隔離された実行環境により、レビュアーは構築者の内部推論や中間ステップにアクセスできません。
このアプローチは、AI生成コードにより厳格な検証を実装したい開発者、特に単一エージェントの自己レビューが確証バイアスを導入する可能性がある複雑なシステムを扱う場合に有用です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

ストケード:チャネルサポートとセキュリティレイヤーを備えたClaudeコードの新たなオーケストレーションツール
Stockadeは、AnthropicのAgent SDKを基盤としたオーケストレーションツールで、チャネルベースのセッション管理、RBAC、AIエージェント向けの詳細な権限制御を提供します。OpenClawやNanoClawの制限に対処し、コンテナ化と認証プロキシによるセキュリティを維持しながら、より多くの制御を実現します。

ルーカス・ゲラッズが、オシロスコープとSPICEシミュレーターの統合のためのMCPサーバーをClaude Codeで実演します。
Lucas Geradsは、LeCroyオシロスコープとSPICEシミュレーター用のMCPサーバーを構築し、Claude CodeがSPICE回路とモデルの検証、組み込みプログラミングの処理、時間軸正規化やデータ整列などのデータ分析タスクの自動化を可能にしました。

Vibeyard、複数のClaude Codeセッションを管理するカンバンボードを追加
VibeyardというオープンソースIDEに、カンバンボードが追加されました。カードから直接Claude Codeのエージェントセッションを起動でき、エージェントが完了するとカードは自動的に「Done」に移動します。

クロードコードウルトラプラン ワークフローの変更とパフォーマンス観察
Claude Code UltraPlanは、ターミナルからの起動、ブラウザでのレビューインターフェース、実行オプションを備えたクラウドベースの計画ワークフローを導入します。テストでは、ローカル計画と比較して繰り返し実行が約2倍高速であり、品質向上の結果は一貫していませんでした。