マルチエージェントAIシステムの比較:AnthropicのHarness対AgynのEngineering Orgモデル

✍️ OpenClawRadar📅 公開日: March 31, 2026🔗 Source
マルチエージェントAIシステムの比較:AnthropicのHarness対AgynのEngineering Orgモデル
Ad

Anthropicは長期間実行されるアプリケーション開発のためのハーネス設計を公開し、Agynのチームベース自律型ソフトウェア工学のためのマルチエージェントシステムは先月arXivでオープンソース化されました。両アプローチとも「モノリシックエージェント」モデルを採用せず、代わりにAIエージェントを役割分離、構造化された引き継ぎ、レビューループを持つ実際のエンジニアリングチームのように機能するよう構造化しています。

コアアーキテクチャの違い

Anthropicのシステムは、3つの役割を持つGANに着想を得たアーキテクチャを使用しています:プランナー → ジェネレーター → エバリュエーター。エバリュエーターはPlaywrightを使用して、実際のユーザーのように実行中のアプリケーションと対話し、構造化された批評をジェネレーターに提供します。

Agynは、4つの役割を持つエンジニアリング組織としてプロセスをモデル化しています:調整 → 調査 → 実装 → レビュー。エージェントは隔離されたサンドボックスで動作し、定義された契約を通じて通信します。

共通の問題に対する共有ソリューション

  • 長期間のタスクにおけるモデルの一貫性の喪失: Anthropicは構造化された引き継ぎ成果物を用いたコンテキストリセットを使用し、Agynは役割間の構造化された引き継ぎを用いた圧縮を使用します
  • 自己評価が寛容すぎること: 両システムとも評価を生成から分離しています。Anthropicは少数の例で調整された別個のエバリュエーターエージェントを使用し、Agynは実装から分離された専用のレビュー役割を持っています
  • 曖昧な「完了」基準: Anthropicは作業開始前に交渉されるスプリント契約を使用し、Agynは明示的な受入基準と必要なテストを持つタスク仕様フェーズを持っています
  • 複雑なタスク分解: Anthropicのプランナーは一文のプロンプトを完全な仕様に展開し、Agynの調査エージェントは実装開始前に問題を分解して仕様を作成します
  • コンテキスト不安: Anthropicはクリーンスレートのためのリセットを使用し、Agynはメモリレイヤーを持つ圧縮を使用します
Ad

Agynの特徴的な機能

AgynにはAnthropicのハーネスに存在しない2つの機能が含まれています:

  • エージェントごとの隔離されたサンドボックス: 各エージェントは独自の隔離されたファイルとネットワーク名前空間で動作し、並列または順次作業中の共有状態での衝突を防止します
  • 共有状態としてのGitHub: このシステムは、人間のチームが既に理解しているGitHubプリミティブ(コミット、コメント、PR、レビュー)を使用し、カスタム通信プロトコルを必要とせずに完全な監査ログを提供します

実装の違い

Anthropicのハーネスは、Claude Agent SDKと評価ループのためのPlaywright MCPを使用して、Claudeを中心に緊密に構築されています。エバリュエーターはスコアリング前にライブ実行中のアプリケーションをナビゲートします。

Agynは設計上モデルに依存せず、Claude、Codex、およびオープンウェイトモデルをサポートしています。このシステムは役割ごとに異なるモデルを混合することを可能にし、実際には一つのモデルをすべてに使用するよりも優れたパフォーマンスを示すことが分かっています。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Roost: Claude Code用のシングルGoバイナリサイドバー – クリック可能なプロンプト履歴、ファイルツリー、通知機能
Tools

Roost: Claude Code用のシングルGoバイナリサイドバー – クリック可能なプロンプト履歴、ファイルツリー、通知機能

Roostは単一のGoバイナリで、Claude CodeにWebベースのサイドバーを追加します:tmuxをバックエンドとするxterm.jsターミナル、cdに追従するファイルツリー、~/.claude/projects/*.jsonlからのクリック可能なプロンプト履歴、Claude CodeのStopフックを使ったプッシュ通知。SSH越しにシングルユーザー・インスタンスとして動作し、フロントエンドのビルドステップは不要です。

OpenClawRadar
ClaudyBro:Claudeコードワークフロー用のネイティブmacOSターミナル
Tools

ClaudyBro:Claudeコードワークフロー用のネイティブmacOSターミナル

ClaudyBroは、Claude Codeユーザー向けに特別に構築された3.5MBのネイティブSwiftターミナルアプリで、画像貼り付け、プロセス監視、孤立プロセスのクリーンアップ、スマートMCP管理を備えています。アイドル時は68MB、Claude実行時は82MBのメモリを使用します。

OpenClawRadar
フィンガープリントのAIエージェント開発者向け無料Webボット認証テストツール
Tools

フィンガープリントのAIエージェント開発者向け無料Webボット認証テストツール

Fingerprintは、Web Bot Authの実装をテストするための無料の公開エンドポイントをリリースしました。このツールはHTTPリクエストの暗号署名を検証し、ボットやAIエージェントの開発者が本番環境に移行する前にWBAの設定が正しく機能することを確認するのに役立ちます。

OpenClawRadar
Claude Code Plugin Yoinkは、サプライチェーンリスクを低減するためにライブラリ依存関係を置き換えます
Tools

Claude Code Plugin Yoinkは、サプライチェーンリスクを低減するためにライブラリ依存関係を置き換えます

Yoinkは、必要な機能のみを再実装することで複雑な依存関係を排除するClaude Codeプラグインで、/setup、/curate-tests、/decomposeの3段階ワークフローを使用します。現在はPythonをサポートしており、TypeScriptとRustのサポートも進行中です。

OpenClawRadar