Automatisierte Claude-Code-Pipeline reduziert Token-Verbrauch von 78k auf 15k pro Feature

Was Diese Pipeline Leistet
Dies ist eine automatisierte Pipeline für Claude Code, die drei häufige Probleme angeht: Claude, der bestehenden Code neu aufbaut, hohe Token-Kosten (50-80k Token für komplexe Features) und übermäßige manuelle Überwachung. Die Pipeline durchläuft automatisch 12 Phasen mit einem Befehl: /auto-pipeline "add user dashboard with activity feed".
Wichtige Funktionen und Phasen
- Vorabprüfungsphase: Durchsucht Ihre Codebasis und package.json, bevor etwas gebaut wird. Beispiel: Wenn Sie "Authentifizierung hinzufügen" anfordern, erkennt sie bestehende
next-auth-Installationen und empfiehltEXTEND_EXISTINGanstatt von Grund auf neu zu bauen. - Anforderungsextraktion: Minimaler Frage-Antwort-Prozess, um tatsächliche Bedürfnisse zu ermitteln
- Designphase: Erstellt technische Spezifikationen mit Quellenangaben
- Adversarial Review: Greift das Design aus drei Blickwinkeln an
- Planungsphase: Erstellt deterministische Schritte mit exaktem VORHER/NACHHER-Code
- Bauphase: Führt den Plan Schritt für Schritt aus
- QA-Pipeline: Führt Linting, Typüberprüfung, Tests, Dokumentationsgenerierung und Sicherheitsscans durch
Drei Betriebsprofile
--profile=yolo: Schnelles Prototyping, überspringt die meisten Prüfungen (~18k Token)--profile=standard: Ausgewogener Ansatz mit Warnungen bei Problemen (~35k Token)--profile=paranoid: Volle Überwachung für Produktionscode (~50k Token)
Token-Einsparungen im Detail
Ein Feature, das zuvor ~78k Token kostete, läuft jetzt mit dem yolo-Profil in ~15k Token. Optimierungsstrategien umfassen:
- Schlanke Agenten (60-80 % kleinere Prompts): 40-60 % Einsparung
- Caching (Sicherheitsscans, Muster, QA-Regeln): 15-25 % Einsparung
- Phasenüberspringen (yolo-Modus): 30-40 % Einsparung
Ausgabe-basiertes Validierungssystem
Anstatt sich auf Claudes selbstberichtete Konfidenzscores zu verlassen, nutzt die Pipeline objektive grep-basierte Validatoren. Beispielsweise in Phase 3 (Adversarial):
has_verdict→ grep "APPROVED|REVISE"no_high_severity→ ! grep "| HIGH |"no_consensus→ keine Probleme von 2+ Kritikern
Der Ersteller merkt an: "Man kann nicht schummeln, was man nicht selbst berichten kann."
Technische Details und Aktueller Status
Die Pipeline ist für Next.js/TypeScript gebaut, aber so strukturiert, dass sie mit jedem Stack funktioniert. Es gibt einen full-workflow-legacy-Zweig für diejenigen, die die ursprüngliche manuelle Pipeline mit menschlichen Kontrollpunkten bei jedem Schritt bevorzugen. Das Caching umfasst derzeit Sicherheitsscans per Lockfile-Hash, Designmuster und QA-Regeln.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Papierlaternen-MCP-Server verbindet Claude-Code mit Forschungsarbeiten
Paper Lantern ist ein MCP-Server, der mit Claude Code erstellt wurde und Programmieragenten mit über 2 Millionen CS- und 43 Millionen biomedizinischen Forschungsarbeiten verbindet, sodass sie benchmarkte Methoden finden können, anstatt auf Trainingsdaten zurückzugreifen.

KI-Unterprogramme: Deterministische Browser-Automatisierung ohne Token-Kosten
Die KI-Subroutinen von rtrvr.ai ermöglichen es Ihnen, Browser-Aufgaben einmal aufzuzeichnen und als aufrufbare Tools zu speichern, die im Webseitenkontext mit automatisch übernommener Authentifizierung abgespielt werden – ohne LLM-Inferenzkosten und ohne Nichtdeterminismus für wiederkehrende Aufgaben.

Token Enhancer reduziert den Tokenverbrauch von Webseiten für KI-Agenten.
Ein Entwickler stellte fest, dass rohes HTML von Webabrufen übermäßig viele Tokens im KI-Agenten-Kontext verbraucht, wobei Yahoo-Finance-Seiten 704.000 Tokens verwendeten. Durch den Einsatz von Token Enhancer als MCP-Server konnte dies auf 2.600 Tokens reduziert werden.

OpenClaw Client fügt Live-API-Kostenverfolgung, Ausgabenlimits und granulare Agentensteuerung hinzu
Der OpenClaw Client bietet jetzt eine Live-Nutzungsoberfläche mit kreisförmigen Fortschrittsbalken, Ausgabenlimits pro Agent, Unter-Agenten-Verwaltung, Skill-Umschaltung und Modellwechsel von verschiedenen Anbietern.