クロスモデルレビューでAIコードの欠陥を検出する方法と実装例

クロスモデルレビューの仕組み

r/ClaudeAIの開発者が、Codex、Claude Code、CursorなどのAIコーディングエージェントに共通する問題に対処するシステムを構築しました。その問題とは、計画が誰にも仮定を検証されることなく実行されてしまうことです。この解決策では、実行開始前にすべての計画を、異なるアーキテクチャとトレーニングデータを持つ第二のAIモデルにルーティングします。

主要な実装詳細

レビュアーモデルは読み取り専用で、コードに触れることはできません。計画に対して異議を唱えることしかできません。この制約は、「編集できるようになった瞬間、それは批評家ではなくなり、妥協を始める」ため、非常に重要です。システムはラウンド上限付きの自動ループを実行します。問題が見つかった場合、計画は修正のために戻され、合格するか上限に達するまで繰り返されます。

システムが検出するもの

実際にはロールバックしないロールバック計画
実際のセキュリティホールがある権限設計
古い状態から進める/進めないの決定を行うレビューゲート
第二のモデルが全体の流れを追跡するまで首尾一貫しているように聞こえる多段階計画

重要な設計上の決定

スコープ付きレビューコンテキストにより、レビュアーがリポジトリの無関係な部分を読む時間を無駄にすることが防止されます
レビュアーのペルソナ（デリバリーリスク、再現性、パフォーマンスコスト、安全性コンプライアンス）により、異なる種類の問題が検出されます
ライブTUIダッシュボードは、フェーズ、ラウンド、判定、重大度、コスト、履歴を1つのターミナルビューで表示します
システムは異なるプランナーと連携します。Claude CodeはネイティブのExitPlanModeフックを使用し、Codexやその他のオーケストレーターは明示的なゲートを使用します