OpenClaw-Orchestrator-Routing-Probleme: Wenn Delegation fehlschlägt

Das Problem: Unzuverlässige Agenten-Delegation
Ein Entwickler, der OpenClaw mit einer Hub-and-Spoke-Multi-Agenten-Architektur betreibt, erlebt unzuverlässiges Routing-Verhalten von seinem Hauptorchestrator. Der Orchestrator versucht häufig, Anfragen direkt zu bearbeiten, anstatt sie an den entsprechenden spezialisierten Sub-Agenten zu delegieren. Laut Bericht fühlt sich das Routing unzuverlässig an, wobei die Delegation nur etwa 50–60 % der Zeit korrekt funktioniert.
Konkrete Beispiele sind: Wenn nach Workouts gefragt wird, gibt der Orchestrator generische Fitnessratschläge, anstatt den Trainingsagenten aufzurufen; wenn nach Wetter gefragt wird, antwortet er mit Trainingsdaten, anstatt den Wetteragenten zu kontaktieren.
Aktuelle Setup-Details
Die Konfiguration des Entwicklers umfasst:
- Hauptorchestrator für die Benutzerinteraktion
- 7 spezialisierte Sub-Agenten für: Gmail/Kalender/Drive, Todoist, persönliches Training/Notion, Lebensmittelbestand, Mahlzeitenplanung, Wetter und Zugfahrpläne
- Explizite Routing-Tabelle, die Anfragemuster mit Agenten-IDs verknüpft
- Harte Regel: „Du bist ein ROUTER, kein WORKER – wenn eine Anfrage in den Bereich eines Spezialisten fällt, MUSST du delegieren“
- Jeder Spezialist hat seinen Bereich klar definiert
- Agent-zu-Agent-Kommunikation in der Konfiguration aktiviert
- Orchestrator-Modell: gpt-5.4 über openai-codex
Versuchte Lösungen
Der Entwickler hat mehrere Ansätze ausprobiert, um das Routing-Problem zu beheben:
- Hinzufügen von „NIEMALS“-Regeln für jeden Bereich (z. B. NIEMALS E-Mail-Fragen selbst beantworten, NIEMALS Wetter selbst prüfen)
- Hinzufügen einer „im Zweifel delegieren“-Regel
- Erstellen einer sehr expliziten Routing-Tabelle mit Beispielphrasen
Wichtige Fragen des Entwicklers
Der Entwickler sucht praktische Ratschläge zu mehreren spezifischen Problemen:
- Gibt es ein bekanntes funktionierendes Prompt-Muster, um zuverlässige Delegation in OpenClaw zu erzwingen?
- Spielt die Modellauswahl für den Orchestrator eine signifikante Rolle? Sollte es ein stärkeres oder schwächeres Modell sein?
- Ist der Routing-Tabellen-Ansatz der richtige, oder gibt es eine bessere Strukturierung?
- Erfahrungen damit, wie OpenClaws
subagents.allowAgents-Konfiguration das Routing-Verhalten beeinflusst?
Der Entwickler stellt fest, dass einzelne Agenten gut funktionieren, sobald sie Anfragen erhalten, was darauf hindeutet, dass der Engpass rein beim Routing-Schritt liegt.
📖 Read the full source: r/openclaw
👀 Siehe auch

OpenClaw Anwendungsfall: Erstellung eines täglichen persönlichen Nachrichtendigests mit KI
Ein Entwickler teilt sein OpenClaw-Setup für einen täglichen Nachrichtenüberblick, der einen Cronjob mit einem detaillierten Prompt verwendet, der Nachrichtenquellen, Interessenschwerpunkte und das Ausgabeformat festlegt. Das System ruft RSS-Feeds von vertrauenswürdigen niederländischen Publikationen ab und liefert jeden Morgen 5 kuratierte Geschichten.

Claude Opus 4.6 analysiert Buffett-Briefe, um blind Aktien auszuwählen
Ein Entwickler nutzte Claude Code mit Subagenten, um Warren Buffetts Anlageprinzipien aus 48 Jahren Aktionärsbriefen (561.849 Wörter) zu extrahieren und wandte sie dann an, um 50 anonymisierte Aktien zu bewerten. Opus 4.6 identifizierte korrekt 60 % der tatsächlichen Beteiligungen Berkshires in seinen Top-10-Auswahlen, während es Anti-Buffett-Kontrollen ablehnte.

Hybrider Lokaler+API-Ansatz senkt KI-Kosten um 79 % in monatelangem Test
Ein Entwickler, der einen 24/7-KI-Assistenten auf einem Hetzner-VPS betreibt, hat die monatlichen Kosten von 288 $ auf 60 $ gesenkt, indem er lokale Modelle strategisch mit API-Aufrufen kombiniert. Das Setup verwendet nomic-embed-text für Embeddings und Qwen2.5 7B für Hintergrundaufgaben, während komplexere Arbeiten an Claude-Modelle weitergeleitet werden.

Finanzmodellierer entwickelt lokale Sprach-zu-Werkzeug-Desktop-App mit Claude Code
Ein Entwickler mit einem Hintergrund in Finanzmodellierung nutzte Claude Code, um Sotto zu erstellen, eine lokale Windows-Spracherkennungsanwendung, die Whisper auf der GPU ausführt. Die App bietet systemweite Tastenkombinationen, automatische Stopp-Erkennung und eine Qt-Benutzeroberfläche mit etwa 2.200 Zeilen Python-Code über 17 Dateien verteilt.