Aufbau eines sprachgesteuerten Multi-Agenten-Systems auf Basis von Claude Code

✍️ OpenClawRadar📅 Veröffentlicht: 25. Mai 2026🔗 Source
Aufbau eines sprachgesteuerten Multi-Agenten-Systems auf Basis von Claude Code
Ad

Ein Entwickler auf r/ClaudeAI baute als Wochenendprojekt eine Sprachsteuerung für Claude Code auf macOS, komplett mit Wake-Word, WebRTC-Sprachschleife und einem Multi-Agent-Orchestrierungssystem. Was als praktischer Hack begann, entwickelte sich zu einem System, bei dem ein Leiter-Agent Aufgaben zerlegt, Unter-Agents rekrutiert und diese parallel mit automatisch ausgelösten Qualitätssicherungsschleifen ausführt.

Wie es funktioniert

  • Wake-Wort: „Yabby“ löst die Sprachschleife aus. Der Entwickler wählte ein benutzerdefiniertes Wake-Wort, um Konflikte mit Siri oder anderen Assistenten zu vermeiden.
  • Sprachschleife: WebRTC übernimmt die Echtzeit-Audio-Streaming. Das System nutzt die Anthropic Realtime API für Sprache-zu-Text und Text-zu-Sprache; die angestrebte Latenz liegt unter 300 ms, aber die API verursacht manchmal Verzögerungen.
  • Leiter-Agent: Erhält die Sprachanfrage, führt eine Entdeckungsphase durch, erstellt einen Projektplan und rekrutiert ein kleines Team (Manager + 2-3 Unter-Agents) zur Ausführung der Schritte.
  • Parallele Ausführung: Unter-Agents laufen wo möglich parallel, sonst sequenziell. Jeder Agent erhält eine eigene Claude Code CLI-Sitzung mit einem separaten Thread – die Gespräche vermischen sich nicht.
  • Automatische Qualitätssicherung: Wenn ein Unter-Agent fertig ist, wird eine Überprüfung mit einer 5-Sekunden-Entprellung ausgelöst, um Staus zu vermeiden. Während der Tests fing ein Agent einen Fehler eines anderen Agents – ein emergentes Verhalten, das der Entwickler nicht erwartet hatte.
  • Planbestätigungs-Modal: Bevor ein Agent ausführt, erscheint ein Modal, damit der Benutzer den Plan prüfen kann. So wird verhindert, dass das System unverifizierte Aktionen ausführt.
Ad

Schwachstellen

  • Sprecherverifizierung: Nutzt Kosinus-Ähnlichkeit auf Sprecher-Embeddings. Der Schwellwert ist schwer einzustellen – zu streng lehnt den Benutzer ab, wenn er erkältet ist; zu lasch erlaubt jedem im Raum, Befehle auszulösen.
  • Gebietsschema-Probleme: Französisch war das Standard-Gebietsschema, weil der Code so geschrieben war. Der Entwickler bessert es langsam aus.
  • Lebenszyklus von Hintergrundaufgaben: Wenn der übergeordnete Claude Code CLI-Prozess beendet wird, sterben Hintergrundaufgaben still. Der Entwickler schrieb einen OS-weiten PID-Watcher mit einem Buchhalter-Shellskript, um zu verfolgen, welche langlebigen Server abgestürzt sind.
  • Überplanung: Der Leiter-Agent erstellt manchmal einen vierphasigen Projektplan für triviale Anfragen wie das Umbenennen einer Datei.

Offene Fragen

Der Entwickler überlegt noch, wie er die Ausführlichkeit in der Qualitätssicherungsphase reduzieren kann, ob Unter-Agents eigene Unter-Agents rekrutieren dürfen (rekursive Delegation) und wie die Sprachlatenz unter 300 ms bleibt, wenn die Realtime API zickt. Er ist auch neugierig, wie der offizielle Sprachmodus von Anthropic (ausgerollt an 5 % der Nutzer) die Multi-Agent-Koordination handhabt.

📖 Vollständige Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Bio-inspiriertes Gedächtnissystem für lokale LLMs: Implementierung von LTP und selektivem Vergessen
Werkzeuge

Bio-inspiriertes Gedächtnissystem für lokale LLMs: Implementierung von LTP und selektivem Vergessen

Ein Entwickler hat einen lokalen MCP-Server erstellt, der bio-inspirierte Gedächtnismechaniken implementiert, einschließlich Long-Term-Potentiation-Verstärkung, selektivem Vergessen durch Zerfall und wöchentlichen Konsolidierungszyklen. Das System nutzt Hybridsuche mit sqlite-vec und Text-Fallbacks, eine nicht-blockierende Architektur mit asyncio-Executors und bewahrt den Zustand über eine persistente 'Soul'-Datei.

OpenClawRadar
Nanocode: Training Claude-like coding agents with JAX on TPUs
Werkzeuge

Nanocode: Training Claude-like coding agents with JAX on TPUs

Nanocode ist eine JAX-Bibliothek zum end-to-end-Training von Claude-ähnlichen Coding-Agenten unter Verwendung von Constitutional AI und TPU-Optimierung. Das 1,3-Milliarden-Parameter-Modell kann in ~9 Stunden für 200 US-Dollar auf TPU v6e-8 trainiert werden.

OpenClawRadar
Shieldbot: Open-Source-Sicherheitsscanner-Plugin für Claude Code
Werkzeuge

Shieldbot: Open-Source-Sicherheitsscanner-Plugin für Claude Code

Shieldbot ist ein Open-Source-Sicherheitsscanner, der als Plugin innerhalb von Claude Code läuft und sechs Scanner integriert, darunter Semgrep mit über 5.000 Regeln, Bandit, Ruff, detect-secrets, pip-audit und npm audit. Er dedupliziert Funde und erstellt priorisierte Berichte mit Risikobewertungen und Code-Korrekturen.

OpenClawRadar
Käuferbewertung: Claude-Fähigkeit zur B2B-Anbieterbewertung mittels KI-Agenten-Konversationen
Werkzeuge

Käuferbewertung: Claude-Fähigkeit zur B2B-Anbieterbewertung mittels KI-Agenten-Konversationen

Eine Claude-Fähigkeit, die B2B-Softwareanbieter bewertet, indem sie Ihr Unternehmen recherchiert, domänenspezifische Fragen stellt und direkt mit den KI-Agenten der Anbieter über die Salespeak Frontdoor API kommuniziert. Sie gleicht Behauptungen mit unabhängigen Quellen ab und erstellt evidenzbasierte Scorecards mit transparenten Verifizierungsstufen.

OpenClawRadar