Der Engpass bei parallelen KI-Agenten: Warteschlange für menschliche Genehmigung

✍️ OpenClawRadar📅 Veröffentlicht: 19. Mai 2026🔗 Source

Mehrere Claude Code Agents parallel laufen zu lassen, klingt nach einem Durchsatz-Multiplikator – 5 Agents sollten 5× Output bedeuten. In der Praxis wird der Mensch nach zwei Stunden zum Flaschenhals. Ein Reddit-Beitrag beschreibt das Muster: Ein Agent stoppt bei einer Ja/Nein-Frage, Sie schalten per Alt-Tab um, um zuzustimmen, zwei weitere pausieren, Sie verlieren den Kontext, und plötzlich verwalten Sie eine Entscheidungswarteschlange, anstatt Code zu schreiben.

Der Autor nennt dies den Bottleself: die Grenze, ab der das Hinzufügen von Agents die Ausgabe nicht mehr steigert, sondern schneller Freigaben erzeugt, als eine Person sie verarbeiten kann. Der begrenzende Faktor sind nicht Tokens, Modellgeschwindigkeit oder Kontextfenster – es ist die Latenz des Menschen in der Schleife.

Vorgeschlagene Lösung: Eine Planer-Ebene

Der Autor hat einen übergeordneten Planer entwickelt (verfügbar als npx gekto), der:

Ein übergeordnetes Ziel nimmt
Es in parallele Teilaufgaben zerlegt
Einen Claude Code Sub-Agenten pro Teilaufgabe startet
Einen QA-Sub-Agenten zur Überprüfung der Ausgabe ausführt
Den Menschen nur dann kontaktiert, wenn das System wirklich nicht entscheiden kann

Unterstützt derzeit nur Claude Code. Integrationen für Codex, Cursor und Aider sind als Nächstes geplant. Bei einem neuen Repository mit Claude Code übernimmt der Planer die Zerlegung und parallele Ausführung von Anfang bis Ende ohne Tastatureingriff.

Die ehrliche Frage an alle, die 5+ Agents betreiben: Wie viel Ihres Tages verbringen Sie tatsächlich mit dem Schreiben von Code im Vergleich zum Abarbeiten der Warteschlange, die Ihre Agents erzeugt haben? Wo trifft der Bottleself bei Ihnen?

Quelle: github.com/gekto-dev/gekto

📖 Vollständige Quelle lesen: r/ClaudeAI

👀 Siehe auch

Werkzeuge

9 Bausteine für den Betrieb von Claude Code als persistentes Betriebssystem über 18 Unternehmen hinweg

Ein Entwickler betreibt 18 Claude Code-Instanzen als gemeinsames Betriebssystem mit selektiver Synchronisation, ausgelagerter Zustandsverwaltung auf MCP-Server, quittungsbasierter Verifikation und automatisch geladenen Regeln. Beschreibt die Architektur.

19. Mai 2026, 00:15 UTC

OpenClawRadar

Werkzeuge

Tessera: Open-Source-GUI-Arbeitsbereich zur Verwaltung mehrerer Claude Code-Sitzungen

Tessera ist eine quelloffene GUI, mit der Sie mehrere Claude Code-Sitzungen parallel mit Git-Worktree-Isolation, Kanban-Aufgabenverfolgung, Live-Diffs und Agentenaktivitätsprüfung ausführen können.

7. Mai 2026, 12:18 UTC

OpenClawRadar

Werkzeuge

OpenClaw-Benchmark zeigt: Qwen3.5:27B übertrifft andere lokale LLMs bei Agenten-Aufgaben

Ein Benchmark von 7 lokalen LLMs bei 22 realen Agentenaufgaben mit OpenClaw ergab, dass qwen3.5:27b-q4_K_M mit 59,4 % abschnitt, während der Zweitplatzierte qwen3.5:35b nur 23,2 % erreichte. Die meisten Modelle konnten grundlegende Werkzeuge wie E-Mail-Funktionen nicht finden.

28. März 2026, 14:45 UTC

OpenClawRadar

Werkzeuge

Lokales RAG-Tool, erstellt mit Nemotron Nano 9B v2 und vLLM-Tool-Aufrufen

Ein Entwickler hat ein lokales RAG-Forschungstool erstellt, das vollständig auf einer einzelnen GPU läuft, indem er Nemotron Nano 9B v2 Japanese auf vLLM mit benutzerdefinierten Parser-Plugins für Tool-Aufrufe verwendet. Das System verfügt über einen zweistufigen Extraktions-Ausführungs-Flow mit zweisprachiger Schlüsselwortextraktion und paralleler FTS5/DuckDuckGo-Suche.

27. März 2026, 05:45 UTC

OpenClawRadar