マルチモデルコードレビューワークフロー、再利用可能スキルとしてパッケージ化

開発者が、マルチモデルコードレビューワークフローを再利用可能なスキル/ランブックとしてパッケージ化し、GitHubで公開しました。このアプローチでは、1つのオーケストレーターエージェントが複数の独立したレビューアーエージェント/モデルを調整し、最終的なレビューに結果を統合します。重要なポイントは、異なるモデルが異なるバグを捉え、複数のモデルが同じ問題を独立して指摘すると信頼性が向上することです。オーケストレーターは重複を排除し、弱い指摘をフィルタリングし、明らかな誤検出をチェックして、1つのクリーンな結果を公開します。
2つのモード
このワークフローは2つのモードをサポートします。
- PRレビュー: ローカルの
base/、head/、PR_DIFF.patch、PR_METADATA.jsonを準備し、複数の分析専用レビューアーを起動した後、オーケストレーターが1つのサマリーとインラインPRコメントを投稿します。GitHubの保留中レビュー衝突を避けるように設計されています。 - 非PRスコープレビュー: フォルダ/モジュール/デプロイ/スクリプト領域をレビュー。レビューアーは共有のローカルスナップショットを検査し、オーケストレーターが統合された
REVIEW.mdをリポジトリに公開します。
テスト済みモデル構成
テストされた構成では、GPT-5.5をオーケストレーターとして使用し、GPT-5.5、DeepSeek V4 Pro、Kimi K2.6、Qwen 3.6 Plus、GLM-5.1をレビューアーとして使用しています。ただし、このワークフローはエージェント/モデルに依存しません。OpenClawでテスト済みであり、優れた結果が得られると報告されています。
主要な教訓
- 共有スナップショット: 各サブエージェントが独立してリポジトリをクローン/フェッチしないようにします。オーケストレーターが共有スナップショットを準備し、ローカルパスをレビューアーに渡すべきです。高速で低コスト、かつ奇妙な誤検出が減ります。
- GPT以外のモデルはすべてFireworksを介して実行されました。大規模なタスクでは、著者はKimiとQwenを他のものに交換することを提案しています。これらの2つは時々動作が不安定になるためです。
リポジトリはgithub.com/rmichelena/multireviewにあります。著者は、特にマルチエージェントコードレビューワークフローを実行している人からのフィードバックを求めています。
📖 全文ソースを読む: r/openclaw
👀 See Also

LocalSynapse MCPサーバーにより、Claudeはオフラインでローカル文書を検索可能になります
LocalSynapseは、ハイブリッドBM25 + AIセマンティック検索を使用してローカルドキュメント(Word、Excel、PowerPoint、PDF)をインデックス化および検索するMCPサーバーです。すべてがローカルで実行され、クラウドやAPIキーは必要ありません。

Claude Code対Codex:実世界でのビルドテスト – 36ファイル対28ファイル、無限ループ、0.46ドルのコスト差
ある開発者が、クロード・コードとカーソルのコーデックスを、PRトリアージボットとWebSocketコードレビューUIという2つの実際のタスクで比較した。クロードは12分で36ファイルを構築し、TypeScriptエラーはゼロ。コーデックスは動作するUIを生成したが、無限のReactループに陥った。コスト差は約0.46ドル。

FixAI Dev: Claude Haikuを使用した厳格なJSON契約による消費者権利ゲーム
開発者が、Claude Haikuを企業AIとして消費者要求を不当に拒否するシミュレーションを行うブラウザゲーム「FixAI Dev」を作成しました。プレイヤーは実際の消費者保護法を使って反論し、法的に適切な主張をするとAIの確信度が低下します。

BrowserKing: Claudeおよび他のモデルによるブラウザ制御のためのオープンソースChrome拡張機能
BrowserKingは、無料のオープンソースChrome拡張機能で、Claudeや15以上の他のモデルがサイドパネルからブラウザを閲覧・操作できるようにします。画面のスクリーンショットを撮影してモデルに送信し、ボタンのクリック、フォームの入力、スクロール、タブの移動などの決定に基づいて動作します。