Codev AIエージェント：14日間106件PRを自動処理するオープンソースワークフロー

Codevは、構造化された開発ワークフローを強制するオープンソースのAIエージェント調整システムです。このプロジェクトは、14日間で106件のプルリクエストを処理する中から抽出された具体的な実践方法を通じて、AIをプロトタイピングから本番作業へ移行する方法を示しています。

6つのコアプラクティス

仕様と計画はソースコードである: 仕様と計画はチャット履歴ではなく、ソースコードと共にgitで管理されます。新しいエージェントは全体像を把握するためにarch.mdを読み、その後、特定の仕様を確認します。これにより、何がなぜ構築されたのかを常に把握できます。
各フェーズを3つのモデルがレビュー: Claude、Gemini、Codexはほぼ完全に異なるバグを検出します。単一のモデルが55%以上の課題を見つけることはありませんでした。テストでは、出荷前に20のバグが検出されました：Claude Codeは5つのバグを発見し、GeminiとCodexはClaudeが見逃した深刻なセキュリティ問題を含むさらに15のバグを検出しました。
プロセスを提案ではなく強制する: ステートマシンがSpec → Plan → Implement → Review → PRを強制します。AIはステップをスキップできず、テストに合格しなければ次に進めません。AI自体では計画に従わないため、システムがガイドラインを提供します。
編集ではなく注釈を付ける: ほとんどの作業は、オープンエンドのチャットでファイルを修正するのではなく、コードを導く仕様とレビューを書くことに関わります。
エージェントがエージェントを調整する: アーキテクトエージェントがビルダーエージェントを分離されたgitワークツリーに生成します。あなたはアーキテクトを指示し、アーキテクトはビルダーを指示します。彼らは非同期にメッセージを交換します。
ライフサイクル全体を管理する: ほとんどのAIツールはコードをより速く書くのを支援します（仕事の約30%）。残りの70%は計画、レビュー、統合、デプロイメントスクリプト、ステージングと本番の管理を含みます。CodevはAIに仕様からPR以降までのパイプライン全体を実行させます。

結果とコスト

このシステムにより、1人のエンジニアが通常3-4人のチームが行う作業を生産できるようになりました。コード品質は、Claude Code単独で使用した場合と比較して、10点満点で1.2ポイント高い評価を得ました。このアプローチは時間がかかり、より多くのトークンを使用しますが、コストは1PRあたり約1.60ドルと合理的です。

開発者によると、プロトコルの強制がゲームチェンジャーです：「AIが仕様や計画に従わないことがわかりました。」エージェント調整も効果的で、アーキテクトエージェントが複数のビルダーエージェントを管理し、異なるバグを同時に修正しました。

📖 完全なソースを読む: HN AI Agents

Codev：14日間で106件のPRを処理するAIエージェントワークフロー

6つのコアプラクティス

結果とコスト

👀 See Also

WordPress.com MCP統合により、Claudeに書き込み機能が追加されました

CKサーチ：MCPサーチバー統合を備えたローカルセマンティック検索ツール

ネットワークサンドボックスと自動解体機能を備えた一時的なOpenClawセットアップ

Gigacatalyst：SaaSにAIビルダーを組み込み、ユーザーがカスタムワークフローを作成できるようにする