マルチエージェントAI比較：Anthropic Harness vs Agyn Engineering Org

Anthropicは長期間実行されるアプリケーション開発のためのハーネス設計を公開し、Agynのチームベース自律型ソフトウェア工学のためのマルチエージェントシステムは先月arXivでオープンソース化されました。両アプローチとも「モノリシックエージェント」モデルを採用せず、代わりにAIエージェントを役割分離、構造化された引き継ぎ、レビューループを持つ実際のエンジニアリングチームのように機能するよう構造化しています。

コアアーキテクチャの違い

Anthropicのシステムは、3つの役割を持つGANに着想を得たアーキテクチャを使用しています：プランナー → ジェネレーター → エバリュエーター。エバリュエーターはPlaywrightを使用して、実際のユーザーのように実行中のアプリケーションと対話し、構造化された批評をジェネレーターに提供します。

Agynは、4つの役割を持つエンジニアリング組織としてプロセスをモデル化しています：調整 → 調査 → 実装 → レビュー。エージェントは隔離されたサンドボックスで動作し、定義された契約を通じて通信します。

共通の問題に対する共有ソリューション

長期間のタスクにおけるモデルの一貫性の喪失： Anthropicは構造化された引き継ぎ成果物を用いたコンテキストリセットを使用し、Agynは役割間の構造化された引き継ぎを用いた圧縮を使用します
自己評価が寛容すぎること： 両システムとも評価を生成から分離しています。Anthropicは少数の例で調整された別個のエバリュエーターエージェントを使用し、Agynは実装から分離された専用のレビュー役割を持っています
曖昧な「完了」基準： Anthropicは作業開始前に交渉されるスプリント契約を使用し、Agynは明示的な受入基準と必要なテストを持つタスク仕様フェーズを持っています
複雑なタスク分解： Anthropicのプランナーは一文のプロンプトを完全な仕様に展開し、Agynの調査エージェントは実装開始前に問題を分解して仕様を作成します
コンテキスト不安： Anthropicはクリーンスレートのためのリセットを使用し、Agynはメモリレイヤーを持つ圧縮を使用します

Agynの特徴的な機能

AgynにはAnthropicのハーネスに存在しない2つの機能が含まれています：

エージェントごとの隔離されたサンドボックス： 各エージェントは独自の隔離されたファイルとネットワーク名前空間で動作し、並列または順次作業中の共有状態での衝突を防止します
共有状態としてのGitHub： このシステムは、人間のチームが既に理解しているGitHubプリミティブ（コミット、コメント、PR、レビュー）を使用し、カスタム通信プロトコルを必要とせずに完全な監査ログを提供します