Fallstudie: Verwendung von LLM-Prompts anstelle von programmatischem Scaffolding für Multi-Agenten-Software-Erstellung

Systemübersicht und Ergebnisse
Ein Multi-Agenten-System bestehend aus einem Claude-Opus-Orchestrator und Codex-Worker-Agents vollendete 10 vollständig autonome Software-Builds ohne menschliche Code-Intervention. Das System produzierte 10 TypeScript-Browserspiele mit insgesamt über 50.000 Codezeilen und hunderten bestandenen Tests.
Der Orchestrator – ein Frontier-LLM mit Prompt und CLI-Zugriff – zerlegte Ziele, verteilte parallele Worker, analysierte Ergebnisse, priorisierte Fehler und koordinierte die Integration. Es wurde kein programmatisches Gerüst, Zustandsautomat oder Task-Routing verwendet; die Orchestrierungslogik ist ein Prompt, kein Programm.
Wesentliche Erkenntnisse aus der Fallstudie
- Umfangskontrolle durch Prompts scheitert vollständig unter Compiler-Druck (0/20), während mechanische Kontrolle durch nachträgliche Dateiwiederherstellung trivial effektiv ist (20/20)
- Typverträge sind für Integration in allen getesteten Skalen (6–36 Module) nicht erforderlich, wenn der Integrationsagent uneingeschränkten Edit-Zugriff hat
- Der Orchestrator bewahrte perfekte Task-Kontinuität über 11 Kontext-Kompaktierungsereignisse hinweg
- Kostenanalyse zeigt einen Statefulness-Aufschlag: bei ~95% Cache-Trefferquote besteht der Großteil der Orchestrator-Verarbeitung aus dem erneuten Lesen vorheriger Konversationskontexte
- Eine Bare-Prompt-Ablation widerlegt die starke Behauptung, dass Modelle unabhängig Koordinationsmuster entdecken, zeigt aber, dass Solo-Ausführung koordinierte Builds unter ~30K LOC übertrifft
Systemarchitektur und Daten
Das System verwendet eine Baumarchitektur: Ein Mensch gibt Ziele an einen Claude-Opus-Orchestrator, der Arbeit in parallele Tasks zerlegt und an Codex-Worker verteilt. Worker operieren vollständig autonom und kommunizieren ausschließlich über das Dateisystem.
Der vollständige Datensatz umfasst:
- 10 Claude-Orchestrator-Sessions (52 MB)
- 88 Codex-Worker-Sessions (89 MB)
- 62 Worker-stdout-Logs (186,7 MB, 6,1 Mio. Zeilen)
- 55 Zieldateien mit vollständigem Prompt-Text
- 1 TUI-Ereignislog (21 MB, 173.000 Zeilen)
Gesamtkorpus: 295 Mio. Tokens über 88 Codex-Worker-Sessions und 10 Claude-Orchestrator-Sessions.
Systemevolution
Das System entwickelte sich über etwa sechs Monate in fünf Phasen. Der Operator begann mit manuellem Copy-Paste zwischen dualen LLM-Chat-Fenstern, wechselte zu Terminal-CLI-Tools für Dateisystemzugriff, baute dann ein programmatisches Gerüst mit Speicher und Routing. Das Gerüst funktionierte, war aber spröde – jeder Edge-Case erforderte neuen Code. Eine einzelne Claude-Session mit CLI-Zugriff übertraf es.
Das resultierende System, orch-minimal, behält 62.792 Zeilen unterstützenden Codes, aber die Kern-Orchestrierungslogik ist ein Prompt, kein Programm.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Qwen 3.6 27B Q8_k_xl als lokaler täglicher Treiber für VSCode
Ein Entwickler berichtet über seine Erfahrungen mit Qwen-3.6-27B-q8_k_xl von Unsloth in VSCode Insiders über LM Studio auf einer RTX 6000 Pro und findet es für alltägliche Programmieraufgaben ohne API-Tokens ‚gut genug‘.

Wie günstige KI-Agenten die Entwicklung des Claw Earn-Marktplatzes einem Stresstest unterzogen
Das Claw Earn-Team setzte während der Entwicklung absichtlich kostengünstigere, weniger leistungsfähige KI-Agenten ein, was Fehler im Zusammenhang mit veralteten Skripten, veralteten Speicherinhalten und falschen Annahmen aufdeckte. Diese Fehler zwangen zu Verbesserungen bei der Dokumentation und der Robustheit der Plattform.

Reduzierung von KI-Agenten-Kontextüberlastung durch Single-Workspace-Architektur
Ein Entwickler teilt mit, wie er den Startkontext des KI-Assistenten von 27.000 auf 4.000 Token reduziert hat, indem er einen Einzelarbeitsbereich-Ansatz anstelle komplexer Agentenschwärme implementierte, mit kanalbasierter Identitätseinschleusung und getrennten Speicherordnern.

Claude Partner-Programm: Zwei-Personen-Beratung löst Zehn-Personen-Anforderung mit zertifizierten Unabhängigen
Eine KI-Beratung mit nur zwei Personen nutzte Claude, um ins Anthropic-Partnerprogramm aufgenommen zu werden. Jetzt hilft Claude ihnen, eine Gruppe zertifizierter Freelancer aufzubauen, um die Anforderung von zehn Mitarbeitern zu erfüllen.