Der Engpass bei parallelen KI-Agenten: Warteschlange für menschliche Genehmigung

Mehrere Claude Code Agents parallel laufen zu lassen, klingt nach einem Durchsatz-Multiplikator – 5 Agents sollten 5× Output bedeuten. In der Praxis wird der Mensch nach zwei Stunden zum Flaschenhals. Ein Reddit-Beitrag beschreibt das Muster: Ein Agent stoppt bei einer Ja/Nein-Frage, Sie schalten per Alt-Tab um, um zuzustimmen, zwei weitere pausieren, Sie verlieren den Kontext, und plötzlich verwalten Sie eine Entscheidungswarteschlange, anstatt Code zu schreiben.
Der Autor nennt dies den Bottleself: die Grenze, ab der das Hinzufügen von Agents die Ausgabe nicht mehr steigert, sondern schneller Freigaben erzeugt, als eine Person sie verarbeiten kann. Der begrenzende Faktor sind nicht Tokens, Modellgeschwindigkeit oder Kontextfenster – es ist die Latenz des Menschen in der Schleife.
Vorgeschlagene Lösung: Eine Planer-Ebene
Der Autor hat einen übergeordneten Planer entwickelt (verfügbar als npx gekto), der:
- Ein übergeordnetes Ziel nimmt
- Es in parallele Teilaufgaben zerlegt
- Einen Claude Code Sub-Agenten pro Teilaufgabe startet
- Einen QA-Sub-Agenten zur Überprüfung der Ausgabe ausführt
- Den Menschen nur dann kontaktiert, wenn das System wirklich nicht entscheiden kann
Unterstützt derzeit nur Claude Code. Integrationen für Codex, Cursor und Aider sind als Nächstes geplant. Bei einem neuen Repository mit Claude Code übernimmt der Planer die Zerlegung und parallele Ausführung von Anfang bis Ende ohne Tastatureingriff.
Die ehrliche Frage an alle, die 5+ Agents betreiben: Wie viel Ihres Tages verbringen Sie tatsächlich mit dem Schreiben von Code im Vergleich zum Abarbeiten der Warteschlange, die Ihre Agents erzeugt haben? Wo trifft der Bottleself bei Ihnen?
Quelle: github.com/gekto-dev/gekto
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

9 Bausteine für den Betrieb von Claude Code als persistentes Betriebssystem über 18 Unternehmen hinweg
Ein Entwickler betreibt 18 Claude Code-Instanzen als gemeinsames Betriebssystem mit selektiver Synchronisation, ausgelagerter Zustandsverwaltung auf MCP-Server, quittungsbasierter Verifikation und automatisch geladenen Regeln. Beschreibt die Architektur.

Tessera: Open-Source-GUI-Arbeitsbereich zur Verwaltung mehrerer Claude Code-Sitzungen
Tessera ist eine quelloffene GUI, mit der Sie mehrere Claude Code-Sitzungen parallel mit Git-Worktree-Isolation, Kanban-Aufgabenverfolgung, Live-Diffs und Agentenaktivitätsprüfung ausführen können.

OpenClaw-Benchmark zeigt: Qwen3.5:27B übertrifft andere lokale LLMs bei Agenten-Aufgaben
Ein Benchmark von 7 lokalen LLMs bei 22 realen Agentenaufgaben mit OpenClaw ergab, dass qwen3.5:27b-q4_K_M mit 59,4 % abschnitt, während der Zweitplatzierte qwen3.5:35b nur 23,2 % erreichte. Die meisten Modelle konnten grundlegende Werkzeuge wie E-Mail-Funktionen nicht finden.

Lokales RAG-Tool, erstellt mit Nemotron Nano 9B v2 und vLLM-Tool-Aufrufen
Ein Entwickler hat ein lokales RAG-Forschungstool erstellt, das vollständig auf einer einzelnen GPU läuft, indem er Nemotron Nano 9B v2 Japanese auf vLLM mit benutzerdefinierten Parser-Plugins für Tool-Aufrufe verwendet. Das System verfügt über einen zweistufigen Extraktions-Ausführungs-Flow mit zweisprachiger Schlüsselwortextraktion und paralleler FTS5/DuckDuckGo-Suche.