Nelson v2.2.3 リリース: マルチエージェント協調とシミュレーションベンチマーク

Nelson v2.2.3がリリースされました。これは、Claude Code向けのマルチエージェント連携スキルで、イギリス海軍のメタファー（提督、艦長、艦船、乗組員）を使用して、並列エージェントが互いの作業を妨げないようにします。MITライセンスで、GitHubで約300スターを獲得しています。

インストール

Claude Code内で以下のコマンドを実行します：

/plugin marketplace add aspegio/nelson
/plugin install nelson@nelson
Use Nelson to build me a battleships game.

その後、提督、艦長、艦船が連携する様子を観察できます。

ベンチマーク結果

本当のニュースは、同じ作者が構築したベンチマークです。離散イベントシミュレーションタスク（合成鉱山のスループット）で、モデル、CLI、スキルの13の組み合わせをテストしています。品質スコア（100点満点）：

ouroboros-max-thinking (opus-4-7): 97
plan-mode (opus-4-7): 96
agent-teams-nelson-max-thinking (opus-4-7): 95
superpowers-max-thinking (opus-4-7): 94
max-thinking (opus-4-7): 92
vanilla-max (sonnet-4-6): 85
xhigh (gpt-5-5, codex): 85
customtools (gemini-3.1-pro): 81

主なポイント：nelsonはouroborosとplan-modeに1〜2ポイント負けましたが、superpowersに1ポイント、vanilla max-thinkingに3ポイント、thinkingなしのsonnetに10ポイント勝ちました。スキルなしのplan-modeが2位になりました——厳選されたスキルは大きな差を生みませんでした。モデルとthinkingの有無が、スキルの選択よりもはるかに重要でした。

注意事項：タスクは1つだけ、品質はNelsonの作者が作成したルーブリックに基づいてスコアリング、コストと精度を組み合わせた指標はまだありません。

📖 Read the full source: r/ClaudeAI

Nelson v2.2.3 リリース: Claude Codeのためのマルチエージェント協調、および離散イベントシミュレーションベンチマーク

インストール

ベンチマーク結果

👀 See Also

オープンソースAIモデルスタック、コスト効率の高いClaude代替品向け

オクトポーダMCPサーバーは、Claudeコードに永続メモリ、ループ検出、監査証跡を追加します

Interact MCP：Claude Codeのための高速ウェブブラウジングと永続的なChromium

OpenClawの自己更新型翻訳システムは、ドメイン用語集を自動的に維持します。