AIコーディングエージェントのためのクロスモデルレビューループが重大な設計上の欠陥を捕捉

クロスモデルレビューの仕組み
r/ClaudeAIの開発者が、Codex、Claude Code、CursorなどのAIコーディングエージェントに共通する問題に対処するシステムを構築しました。その問題とは、計画が誰にも仮定を検証されることなく実行されてしまうことです。この解決策では、実行開始前にすべての計画を、異なるアーキテクチャとトレーニングデータを持つ第二のAIモデルにルーティングします。
主要な実装詳細
レビュアーモデルは読み取り専用で、コードに触れることはできません。計画に対して異議を唱えることしかできません。この制約は、「編集できるようになった瞬間、それは批評家ではなくなり、妥協を始める」ため、非常に重要です。システムはラウンド上限付きの自動ループを実行します。問題が見つかった場合、計画は修正のために戻され、合格するか上限に達するまで繰り返されます。
システムが検出するもの
- 実際にはロールバックしないロールバック計画
- 実際のセキュリティホールがある権限設計
- 古い状態から進める/進めないの決定を行うレビューゲート
- 第二のモデルが全体の流れを追跡するまで首尾一貫しているように聞こえる多段階計画
重要な設計上の決定
- スコープ付きレビューコンテキストにより、レビュアーがリポジトリの無関係な部分を読む時間を無駄にすることが防止されます
- レビュアーのペルソナ(デリバリーリスク、再現性、パフォーマンスコスト、安全性コンプライアンス)により、異なる種類の問題が検出されます
- ライブTUIダッシュボードは、フェーズ、ラウンド、判定、重大度、コスト、履歴を1つのターミナルビューで表示します
- システムは異なるプランナーと連携します。Claude CodeはネイティブのExitPlanModeフックを使用し、Codexやその他のオーケストレーターは明示的なゲートを使用します
実際の成果
開発者はこのシステムを、システム自体の構築に役立てました。「Codexが計画し、Claudeが計画をレビューし、設計は複数ラウンドにわたって収束しました。」このツールはMITライセンスで、GitHubでrival-reviewとして利用可能です。
📖 Read the full source: r/ClaudeAI
👀 See Also

OpenClawとClaude Coworkの比較:ローカル自動化 vs サンドボックス化されたワークフロー
OpenClawは、シェルコマンドの実行とブラウザ自動化を備え、マシン上で常時稼働するローカルエージェントです。一方、Claude CoworkはClaude Desktop内で動作し、ドキュメントとブラウザタスクに特化したサンドボックス環境で稼働します。

ウロボロス、仕様ギャップを埋めるためにClaudeコード向けPM面談モードを追加
Ouroborosには現在、Claude Codeへの引き継ぎ前にガイド付きインタビューを実行するPMモードが含まれています。「解決する問題は何か」「誰のためのものか」「どのような制約が重要か」といった質問を行います。出力は、目標、ユーザーストーリー、制約、成功基準、前提条件、延期項目を含むPRD/PM文書となります。

AIトークンモニター:macOSツールがローカルのClaude使用状況とコストを追跡
開発者がAI Token Monitorを構築しました。これはmacOSのメニューバーアプリで、ローカルのClaudeセッションファイルを読み取り、APIキーなしでトークン使用量、モデル分布、コスト換算を追跡します。このオープンソースツールは、あるユーザーのケースで35日間に650万トークン(API価格で4,924ドル相当)を記録しました。

OpenClaw PARA組織スキルは、ファイルを自動的にプロジェクト、エリア、リソース、アーカイブに仕分けします。
開発者が、ファイルを整理するためのPARAメソッド(プロジェクト、エリア、リソース、アーカイブ)を強制するOpenClawスキルを作成しました。これにより、すべてのコンテンツをルートディレクトリにダンプする代わりに、自動的にソートされます。