マルチモデルコードレビューワークフロー：OpenClaw、GPT-5.5、DeepSeek V4 Pro

開発者が、マルチモデルコードレビューワークフローを再利用可能なスキル/ランブックとしてパッケージ化し、GitHubで公開しました。このアプローチでは、1つのオーケストレーターエージェントが複数の独立したレビューアーエージェント/モデルを調整し、最終的なレビューに結果を統合します。重要なポイントは、異なるモデルが異なるバグを捉え、複数のモデルが同じ問題を独立して指摘すると信頼性が向上することです。オーケストレーターは重複を排除し、弱い指摘をフィルタリングし、明らかな誤検出をチェックして、1つのクリーンな結果を公開します。

2つのモード

このワークフローは2つのモードをサポートします。

PRレビュー: ローカルのbase/、head/、PR_DIFF.patch、PR_METADATA.jsonを準備し、複数の分析専用レビューアーを起動した後、オーケストレーターが1つのサマリーとインラインPRコメントを投稿します。GitHubの保留中レビュー衝突を避けるように設計されています。
非PRスコープレビュー: フォルダ/モジュール/デプロイ/スクリプト領域をレビュー。レビューアーは共有のローカルスナップショットを検査し、オーケストレーターが統合されたREVIEW.mdをリポジトリに公開します。

テスト済みモデル構成

テストされた構成では、GPT-5.5をオーケストレーターとして使用し、GPT-5.5、DeepSeek V4 Pro、Kimi K2.6、Qwen 3.6 Plus、GLM-5.1をレビューアーとして使用しています。ただし、このワークフローはエージェント/モデルに依存しません。OpenClawでテスト済みであり、優れた結果が得られると報告されています。

主要な教訓

共有スナップショット: 各サブエージェントが独立してリポジトリをクローン/フェッチしないようにします。オーケストレーターが共有スナップショットを準備し、ローカルパスをレビューアーに渡すべきです。高速で低コスト、かつ奇妙な誤検出が減ります。
GPT以外のモデルはすべてFireworksを介して実行されました。大規模なタスクでは、著者はKimiとQwenを他のものに交換することを提案しています。これらの2つは時々動作が不安定になるためです。

リポジトリはgithub.com/rmichelena/multireviewにあります。著者は、特にマルチエージェントコードレビューワークフローを実行している人からのフィードバックを求めています。

📖 全文ソースを読む: r/openclaw