Nelson v2.2.3 : coordination multi-agents, benchmark simulation

Nelson v2.2.3 est sorti — une compétence de coordination multi-agents pour Claude Code qui utilise une métaphore de la Royal Navy (amiral, capitaines, navires, équipage) pour empêcher les agents parallèles de marcher sur les plates-bandes des autres. Sous licence MIT, ~300 étoiles sur GitHub.

Installation

Exécutez ces commandes dans Claude Code :

/plugin marketplace add aspegio/nelson
/plugin install nelson@nelson
Utilise Nelson pour me construire un jeu de bataille navale.

Observez ensuite l'amiral, les capitaines et les navires se coordonner.

Résultats du benchmark

La véritable nouvelle est un benchmark construit par le même auteur. Il teste 13 combinaisons de modèle, CLI et compétence sur une tâche de simulation à événements discrets (débit synthétique d'une mine). Scores de qualité (sur 100) :

ouroboros-max-thinking (opus-4-7) : 97
plan-mode (opus-4-7) : 96
agent-teams-nelson-max-thinking (opus-4-7) : 95
superpowers-max-thinking (opus-4-7) : 94
max-thinking (opus-4-7) : 92
vanilla-max (sonnet-4-6) : 85
xhigh (gpt-5-5, codex) : 85
customtools (gemini-3.1-pro) : 81

Point clé : nelson a perdu face à ouroboros et plan-mode de 1 à 2 points mais a battu superpowers de 1 point, vanilla max-thinking de 3 points, et sonnet sans réflexion de 10 points. Plan-mode (sans compétences) a pris la deuxième place — les compétences sélectionnées n'ont pas creusé un écart important. Le modèle et l'activation de la réflexion ont compté bien plus que le choix de la compétence.

Limitations : n=1 tâche, qualité notée par rapport à une grille écrite par l'auteur de Nelson, pas encore de métrique combinée coût/précision.

📖 Lire la source complète : r/ClaudeAI

Nelson v2.2.3 publiée : coordination multi-agents pour Claude Code, plus un benchmark de simulation à événements discrets

Installation

Résultats du benchmark

👀 See Also

AgentHandover : application de barre de menus Mac qui crée des compétences d'agent en observant votre écran

Comment Claude a aidé à rétro-concevoir les protocoles BLE de Garmin pour simuler un capteur de course natif

OpenClaw-Superpowers : Un port natif du framework Superpowers de Jesse Vincent sans dépendance à Claude Code

Gemma Gem : Agent IA embarqué pour l'automatisation de navigateur via WebGPU