マルチエージェントシステム vs 創発的知能：エンジニアリングワークフローの真実

いくつかのマルチエージェントシステムを構築・実験した後、r/LocalLLaMAの開発者は、現在のほとんどの実装は知能の問題ではなく、エンジニアリングの問題を解決していると主張しています。この投稿では、マルチエージェントシステムが実際に何をうまく行い、なぜまだ創発的知能を生み出さないのかを検討しています。

マルチエージェントシステムが実際に得意とすること

開発者の経験から、マルチエージェントシステムは主に3つの実用的なエンジニアリング上の利点を提供します：

タスク分解： 1つの巨大なプロンプトの代わりに、ワークフローを複数のステップに分割します。例：プランナーエージェント→計画を決定、リサーチエージェント→情報を収集、ライターエージェント→コンテンツを生成、批評家エージェント→レビュー。これはうまく機能しますが、本質的には単なるパイプラインです。
並列化： マルチエージェント構成により、タスクを並列実行しやすくなります。例：リサーチエージェント1→論文を検索、リサーチエージェント2→ニュースを検索、リサーチエージェント3→データベースを検索、集約エージェントが結果を結合。これは基本的にLLM推論を備えた分散ワーカーです。
エンジニアリングのモジュール性： 数十のツールを持つ実際のシステムでは、責任ごとにエージェントを分割することで、開発と保守が容易になります。例：検索エージェント→検索ツールを処理、データベースエージェント→DBクエリを処理、コードエージェント→コーディングタスクを処理、プランナーエージェント→推論を処理。これは主にソフトウェアアーキテクチャであり、創発的知能ではありません。

なぜ「エージェント群」が（まだ）創発的知能を生み出さないのか

投稿では3つの構造的限界を指摘しています：

コミュニケーションが非常に高コスト： ニューロンはマイクロ秒単位で通信します。エージェントは数秒かかるLLM呼び出しを通じて通信するため、複雑な相互作用が制限されます。
エージェントは互いに更新できない： ニューラルネットワークはバックプロパゲーションを通じて学習します。エージェントAが間違いを犯しても、エージェントBはそれを批判できますが、実際にはエージェントAの内部モデルは変更されません。
共有された表現空間がない： ニューロンはベクトルを通じて通信します。エージェントは自然言語を通じて通信しますが、これは曖昧で、情報が失われやすく、トークンコストが高いため、複数のエージェント間で情報が急速に劣化します。