ライバルレビュー:AIエージェント計画のためのクロスモデルレビューループ

概要
Rival-reviewは、AIコーディングエージェントが適切なプレッシャーテストなしに実行を開始する、もっともらしい計画を立てるという一般的なパターンに対処するツールです。核となる考え方はシンプルで、計画を提案するモデルとレビューするモデルを分けることです。
仕組み
ループはシンプルです:
- プランナーが計画を作成
- Claudeがスコープされたコンテキストに対してレビュー
- 問題点は修正のために戻される
- ゲートが通過するか最大ラウンドに達するまでループ継続
第2のモデルは、実装開始前に読み取り専用パスで計画を監査します。このクロスモデルレビューは、単なる「計画の磨き上げ」以上のものを検出します:
- 実際にはロールバックしないロールバック計画
- 実際のセキュリティホールがある権限設計
- 古い状態から進める/中止する決定を行うレビューゲート
- 第2のモデルが全体の流れを確認するまで一貫しているように聞こえる多段階計画
主要な設計上の選択
いくつかの設計上の選択が非常に重要であることが判明しました:
- レビュアーは読み取り専用でなければならない
- 自動ループには厳格なラウンド上限が必要
- スコープされたコンテキストが非常に重要
- ライブターミナルダッシュボードにより、レビューループが不透明ではなく検査可能になる
実装の詳細
このツールはさまざまなプランナーと連携します:
- Claude Codeはネイティブの計画終了フックを使用可能
- Codexやその他のオーケストレーターは明示的なプランナーゲートを使用可能
作成者は、このツール自体の構築に活用しました:Codexが計画を立て、Claudeがレビューし、設計は複数ラウンドにわたって収束しました。
入手方法
このツールはMITライセンスで、GitHubで入手可能です:github.com/alexw5702-afk/rival-review。
📖 Read the full source: r/LocalLLaMA
👀 See Also

InsForge:Claudeコードエージェントのためのバックエンドセマンティックレイヤー
InsForgeは、Claude CodeエージェントがAPI統合を推測する代わりに、MCPを通じて検査・設定できる構造化コンポーネントとして、認証、PostgreSQLデータベース、S3互換ストレージ、エッジ/サーバーレス関数、モデルゲートウェイ、サイトデプロイの6つのバックエンドプリミティブを公開しています。

Claude Codeの自動メモリにおけるコンテキスト肥大化を命名スキーマと監査スクリプトで修正する
Claude Codeのスキルは、3タイプの命名規則、必須のフロントマター、メモリファイルの重複排除とコンテキスト負荷削減のためのbash監査スクリプトを強制します。

Tacit: Claude CodeとOpus 4.7で構築されたLLMファーストのプログラミング言語
Tacitは、Claude CodeとOpus 4.7を用いて設計・実装された、実験的なLLMファーストのプログラミング言語です。人間のための便利機能を排除してトークン使用量を最小化し、中級以上のLLM(Sonnet以上)にTacitコードの書き方を教えるプライマーを同梱しています。

OpenJet v0.4:llama.cpp バックエンドを使用したゼロコンフィグのローカルコーディングエージェント
OpenJet v0.4は、ローカルLLM向けのオープンソースターミナルコーディングエージェントで、ハードウェアを自動検出し、llama.cppを設定し、APIキー不要でClaude Codeスタイルのワークフローを提供します。