Codev:14日間で106件のPRを処理するAIエージェントワークフロー

Codevは、構造化された開発ワークフローを強制するオープンソースのAIエージェント調整システムです。このプロジェクトは、14日間で106件のプルリクエストを処理する中から抽出された具体的な実践方法を通じて、AIをプロトタイピングから本番作業へ移行する方法を示しています。
6つのコアプラクティス
- 仕様と計画はソースコードである: 仕様と計画はチャット履歴ではなく、ソースコードと共にgitで管理されます。新しいエージェントは全体像を把握するためにarch.mdを読み、その後、特定の仕様を確認します。これにより、何がなぜ構築されたのかを常に把握できます。
- 各フェーズを3つのモデルがレビュー: Claude、Gemini、Codexはほぼ完全に異なるバグを検出します。単一のモデルが55%以上の課題を見つけることはありませんでした。テストでは、出荷前に20のバグが検出されました:Claude Codeは5つのバグを発見し、GeminiとCodexはClaudeが見逃した深刻なセキュリティ問題を含むさらに15のバグを検出しました。
- プロセスを提案ではなく強制する: ステートマシンがSpec → Plan → Implement → Review → PRを強制します。AIはステップをスキップできず、テストに合格しなければ次に進めません。AI自体では計画に従わないため、システムがガイドラインを提供します。
- 編集ではなく注釈を付ける: ほとんどの作業は、オープンエンドのチャットでファイルを修正するのではなく、コードを導く仕様とレビューを書くことに関わります。
- エージェントがエージェントを調整する: アーキテクトエージェントがビルダーエージェントを分離されたgitワークツリーに生成します。あなたはアーキテクトを指示し、アーキテクトはビルダーを指示します。彼らは非同期にメッセージを交換します。
- ライフサイクル全体を管理する: ほとんどのAIツールはコードをより速く書くのを支援します(仕事の約30%)。残りの70%は計画、レビュー、統合、デプロイメントスクリプト、ステージングと本番の管理を含みます。CodevはAIに仕様からPR以降までのパイプライン全体を実行させます。
結果とコスト
このシステムにより、1人のエンジニアが通常3-4人のチームが行う作業を生産できるようになりました。コード品質は、Claude Code単独で使用した場合と比較して、10点満点で1.2ポイント高い評価を得ました。このアプローチは時間がかかり、より多くのトークンを使用しますが、コストは1PRあたり約1.60ドルと合理的です。
開発者によると、プロトコルの強制がゲームチェンジャーです:「AIが仕様や計画に従わないことがわかりました。」エージェント調整も効果的で、アーキテクトエージェントが複数のビルダーエージェントを管理し、異なるバグを同時に修正しました。
📖 完全なソースを読む: HN AI Agents
👀 See Also

Redditビジネスリサーチ用Claudeコードプラグイン
Claude Codeプラグインは、関連する投稿を検索し、スレッドを分析し、調査結果とソースリンクを含む構造化されたマークダウンレポートを生成することで、企業向けのReddit調査を自動化します。APIキーは不要で、GitHub経由でインストールし、単一のコマンドで実行できます。

オクトポーダMCPサーバーは、Claudeコードに永続メモリ、ループ検出、監査証跡を追加します
ある開発者がOctopodaを構築しました。これはClaude Codeと統合するMCPサーバーで、AIエージェントに永続的なメモリ、ループ検出、監査証跡、共有知識スペースを提供します。このシステムは、セマンティック検索にPostgreSQLとpgvectorを使用し、FastAPIとReactダッシュボードを備えています。

Claude Code LSP: 言語サーバープロトコルによる高速かつ正確なコードナビゲーションの実現
Claude CodeはデフォルトではLSPが無効になっていますが、有効にするとコードナビゲーションが30〜60秒かかるgrep検索から、50ミリ秒で100%正確なクエリに変わります。設定には公式ドキュメントではなくGitHubのissueで発見されたフラグが必要です。

发现的问题插件记录Claude在处理其他任务时忽略的错误
Claude Codeプラグイン。エージェントがスコープ外でバグを発見した際に、docs/found-issues.mdに1行のエントリを記録し、PRマージ時に自動クローズ、トゥームストーン検出機能を備えています。