Nelson v2.2.3 veröffentlicht: Multi-Agent-Koordination für Claude Code, plus ein Benchmark für diskrete Ereignissimulation

Nelson v2.2.3 ist da – eine Multi-Agenten-Koordinationsfähigkeit für Claude Code, die eine Metapher der Royal Navy (Admiral, Kapitäne, Schiffe, Crew) verwendet, um parallele Agenten davon abzuhalten, sich gegenseitig ins Handwerk zu pfuschen. MIT-lizenziert, ~300 Sterne auf GitHub.
Installation
Führen Sie diese Befehle in Claude Code aus:
/plugin marketplace add aspegio/nelson
/plugin install nelson@nelson
Verwende Nelson, um mir ein Schiffeversenken-Spiel zu bauen.Beobachten Sie dann, wie Admiral, Kapitäne und Schiffe koordinieren.
Benchmark-Ergebnisse
Die eigentliche Neuigkeit ist ein Benchmark, der vom gleichen Autor erstellt wurde. Er testet 13 Kombinationen aus Modell, CLI und Fähigkeit bei einer diskreten Ereignissimulation (synthetischer Minendurchsatz). Qualitätsbewertungen (von 100):
- ouroboros-max-thinking (opus-4-7): 97
- plan-mode (opus-4-7): 96
- agent-teams-nelson-max-thinking (opus-4-7): 95
- superpowers-max-thinking (opus-4-7): 94
- max-thinking (opus-4-7): 92
- vanilla-max (sonnet-4-6): 85
- xhigh (gpt-5-5, codex): 85
- customtools (gemini-3.1-pro): 81
Wichtigste Erkenntnis: Nelson verlor gegen ouroboros und plan-mode um 1–2 Punkte, schlug aber superpowers um 1, vanilla max-thinking um 3 und sonnet ohne Denkmodus um 10 Punkte. Plan-mode (ohne Fähigkeiten) belegte den zweiten Platz – kuratierte Fähigkeiten erzielten keinen großen Vorsprung. Das Modell und die Aktivierung des Denkmodus waren weitaus wichtiger als die Wahl der Fähigkeit.
Einschränkungen: n=1 Aufgabe, Qualitätsbewertung anhand eines Rubrik des Autors von Nelson, noch keine kombinierte Kosten/Genauigkeits-Metrik.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

OpenClaws Atoship-Fähigkeit verwandelt den KI-Assistenten in einen Versandmanager.
Die atoship-Fähigkeit für OpenClaw ermöglicht es Nutzern, ihre Versandanforderungen in einfachem Englisch zu beschreiben und übernimmt dann die Auswahl des Transportunternehmens, Preisvergleiche, den Kauf von Etiketten und die Sendungsverfolgung. Beispielbefehle sind 'versende diese 1-Pfund-Box nach New York, günstigste Option'.

Ursache für die Beschädigung von Sitzungstiteln in der Claude Code VS Code-Erweiterung identifiziert
Ein Entwickler hat die architektonische Ursache für die Korruption von Sitzungstiteln in der VS Code-Erweiterung Claude Code identifiziert, die über 20 GitHub-Issues betrifft. Das Problem rührt daher, dass die Erweiterung Titel durch eine rohe Zeichenkettensuche in Sitzungsdateien ausliest, was zu drei Fehlermodi führt.

Der SMELT-Compiler reduziert die OpenClaw-Arbeitsbereich-Tokennutzung um bis zu 95 %.
SMELT kompiliert OpenClaw-Arbeitsbereich-Markdown-Dateien in eine kompaktere Laufzeitform und sendet nur relevante Inhalte an KI-Modelle. Benchmarks zeigen Token-Reduktionen von 76,1 % bis 95,5 % bei Abfragen, wodurch die Neuverarbeitung statischer Dateien wie USER.md und SOUR.md bei jeder Nachricht vermieden wird.
UI und Server für Anthropics Natural Language Autoencoder auf llama.cpp
Ein benutzerdefinierter llama.cpp-Server und eine Mikupad-Benutzeroberfläche für Anthropics Open-Weight Natural Language Autoencoder, die Aktivierungsextraktion, Erklärung, Rekonstruktion und Steuerung durch Bearbeitung von Erklärungen unterstützen.