Nelson v2.2.3 リリース: Claude Codeのためのマルチエージェント協調、および離散イベントシミュレーションベンチマーク

Nelson v2.2.3がリリースされました。これは、Claude Code向けのマルチエージェント連携スキルで、イギリス海軍のメタファー(提督、艦長、艦船、乗組員)を使用して、並列エージェントが互いの作業を妨げないようにします。MITライセンスで、GitHubで約300スターを獲得しています。
インストール
Claude Code内で以下のコマンドを実行します:
/plugin marketplace add aspegio/nelson
/plugin install nelson@nelson
Use Nelson to build me a battleships game.その後、提督、艦長、艦船が連携する様子を観察できます。
ベンチマーク結果
本当のニュースは、同じ作者が構築したベンチマークです。離散イベントシミュレーションタスク(合成鉱山のスループット)で、モデル、CLI、スキルの13の組み合わせをテストしています。品質スコア(100点満点):
- ouroboros-max-thinking (opus-4-7): 97
- plan-mode (opus-4-7): 96
- agent-teams-nelson-max-thinking (opus-4-7): 95
- superpowers-max-thinking (opus-4-7): 94
- max-thinking (opus-4-7): 92
- vanilla-max (sonnet-4-6): 85
- xhigh (gpt-5-5, codex): 85
- customtools (gemini-3.1-pro): 81
主なポイント:nelsonはouroborosとplan-modeに1〜2ポイント負けましたが、superpowersに1ポイント、vanilla max-thinkingに3ポイント、thinkingなしのsonnetに10ポイント勝ちました。スキルなしのplan-modeが2位になりました——厳選されたスキルは大きな差を生みませんでした。モデルとthinkingの有無が、スキルの選択よりもはるかに重要でした。
注意事項:タスクは1つだけ、品質はNelsonの作者が作成したルーブリックに基づいてスコアリング、コストと精度を組み合わせた指標はまだありません。
📖 Read the full source: r/ClaudeAI
👀 See Also

オープンソースAIモデルスタック、コスト効率の高いClaude代替品向け
Redditユーザーが、ローカル実行用のオープンソースモデル(Llama 3.3 70bやDeepSeek R1 32bなど)を活用した実用的なAIモデルスタックを共有。タスクの90%を無料モデルにルーティングすることで、月額AIコストを£60以上から£3未満に削減。

オクトポーダMCPサーバーは、Claudeコードに永続メモリ、ループ検出、監査証跡を追加します
ある開発者がOctopodaを構築しました。これはClaude Codeと統合するMCPサーバーで、AIエージェントに永続的なメモリ、ループ検出、監査証跡、共有知識スペースを提供します。このシステムは、セマンティック検索にPostgreSQLとpgvectorを使用し、FastAPIとReactダッシュボードを備えています。

Interact MCP:Claude Codeのための高速ウェブブラウジングと永続的なChromium
Interact MCPは、プロセス内に永続的なChromiumブラウザを維持することで、ブラウザ操作時間を初回呼び出し後の2-5秒から5-50msに短縮するModel Context Protocolツールです。CSSセレクターなしで要素操作を行うためのrefシステムを備え、ウェブ自動化のための46種類のツールを含んでいます。

OpenClawの自己更新型翻訳システムは、ドメイン用語集を自動的に維持します。
PythonスクリプトがKimi2.5 APIをラップして、ブロックインデックス、タイムスタンプ、セグメンテーションを保持しながら.srtファイルを翻訳します。このシステムは、glossary.json、style.md、memory.jsonlファイルを含むプロジェクトプロファイルを使用し、6時間ごとに公式ソースをスキャンして用語を更新するcronジョブを含みます。