ケーススタディ:マルチエージェントソフトウェア構築におけるプログラムによるスキャフォールディングの代わりにLLMプロンプトを使用する方法

システム概要と結果
Claude OpusオーケストレーターとCodexワーカーエージェントからなるマルチエージェントシステムは、人間のコード介入なしで10の完全自律的ソフトウェアビルドを完了しました。このシステムは合計50,000行以上のコードと数百の合格テストを持つ10のTypeScriptブラウザゲームを生成しました。
オーケストレーター(プロンプトとCLIアクセスを与えられた最先端LLM)は、目標を分解し、並列ワーカーを派遣し、結果を分析し、エラーをトリアージし、統合を調整しました。プログラム的なスキャフォールド、ステートマシン、タスクルーティングインフラは使用されず、オーケストレーションロジックはプログラムではなくプロンプトです。
ケーススタディからの主要な発見
- プロンプトによるスコープ強制はコンパイラの圧力下で完全に失敗(0/20)する一方、事後的なファイル復元による機械的強制は簡単に有効(20/20)
- 統合エージェントが無制限の編集アクセスを持つ場合、テストされたあらゆる規模(6〜36モジュール)で型契約は統合に必要ない
- オーケストレーターは11回のコンテキスト圧縮イベントにわたって完全なタスク継続性を維持
- コスト分析はステートフル性プレミアムを明らかに:約95%のキャッシュヒット率で、オーケストレーター処理の大部分は以前の会話コンテキストの再読み込み
- 単純プロンプトのアブレーションは、モデルが独立して調整パターンを発見するという強い主張を反証するが、約30K LOC以下では単独実行が調整されたビルドを上回ることを明らかに
システムアーキテクチャとデータ
このシステムはツリーアーキテクチャを使用:人間がClaude Opusオーケストレーターに目標を提供し、オーケストレーターが作業を分解して並列タスクとしてCodexワーカーに派遣します。ワーカーは完全自律的に動作し、ファイルシステムを通じてのみ通信します。
完全なデータセットには以下が含まれます:
- 10のClaudeオーケストレーターセッション(52 MB)
- 88のCodexワーカーセッション(89 MB)
- 62のワーカー標準出力ログ(186.7 MB、610万行)
- 完全なプロンプトテキストを含む55の目標ファイル
- 1つのTUIイベントログ(21 MB、17.3万行)
合計コーパス:88のCodexワーカーセッションと10のClaudeオーケストレーターセッションにわたる2億9500万トークン。
システムの進化
このシステムは約6ヶ月にわたる5つのフェーズを経て進化しました。オペレーターは、二重LLMチャットウィンドウ間の手動コピー&ペーストから始め、ファイルシステムアクセスのためのターミナルCLIツールに移行し、メモリとルーティングを持つプログラム的スキャフォールドを構築しました。スキャフォールドは機能しましたが脆弱で、あらゆるエッジケースに新しいコードが必要でした。CLIアクセスを持つ単一のClaudeセッションがそれを上回りました。
結果として得られたシステム、orch-minimalは、62,792行のサポートコードを保持していますが、コアのオーケストレーションロジックはプログラムではなくプロンプトです。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

Coworkは、Claude AIとMCP接続を活用して、スプリント変更ログの生成を自動化します。
プロジェクトマネージャーがCoworkとClaude AIを使用してスプリント終了時の変更履歴タスクを自動化し、2週間ごとに1時間の手作業を削減しました。このシステムはMCP経由でLinearに接続し、完了した課題を取得、ユーザー向けの変更を特定、変更履歴の文章を作成し、自動的に公開します。

開発者がClaude Codeを使って6週間でmacOS用銀行アプリを構築
ある開発者が、Claude Codeを使用してドイツの銀行向けの無料オープンソースmacOSメニューバーアプリ「simplebanking」を作成しました。このアプリは複数の口座の残高をリアルタイムで表示し、取引検索、定期購入の検出機能を備え、すべてのデータをローカルに保存します。

複数のAIエージェントの調整:Discord、Cronジョブ、明確な階層
開発者が3つのOpenClawエージェントを運用し、Discordを共有通信チャネルとして使用することで調整問題を解決しました。Paperclipの高価なハートビートシステムをエージェントごとのcronジョブに置き換え、Claude MaxとOpenAIモデル間で明確なリーダーシップ階層を確立しました。

SaaS製品の洗練のための批判的マーケティング対抗役としてのClaudeの活用
ある開発者が、Claude AIを典型的なコーディングタスク以外に使用する非従来型のワークフローを共有しました。マーケティングコピーを依頼する代わりに、Claudeを「極めて批判的で、やや敵対的なプロダクトマーケター」として設定し、自社のSaaS製品「Prompt Optimizer」を批判させました。このアプローチにより、弱いメッセージングを特定し、機能からユーザーの安心感へと価値提案を洗練させることができました。