GSD-Lite: Zustandsautomat für Claude Code erzwingt TDD

GSD-Lite ist ein Open-Source-MCP-Server, der sich an Claude Code ankoppelt und Projekte durch einen 12-Zustands-Workflow-Automaten laufen lässt. Das Tool ist unter der MIT-Lizenz verfügbar und besteht insgesamt aus etwa 15 Quelldateien.

Wie es funktioniert

Nachdem in einem Gespräch mit Claude geplant wurde, was gebaut werden soll, übernimmt GSD-Lite automatisch: Code schreiben, überprüfen, verifizieren, zur nächsten Phase übergehen. Die Ausführungsschleife folgt diesem Muster:

Orchestrator wählt nächste Aufgabe
Executor schreibt Code (TDD, Checkpoint)
Reviewer prüft (separater Kontext, Spezifikation + Qualität)
Akzeptiert? Nächste Aufgabe. Abgelehnt? Überarbeitung.
Alle Aufgaben erledigt? Phasentor-Prüfung
Tor bestanden? Nächste Phase
Alle Phasen erledigt? Fertig

Hauptmerkmale

TDD-Erzwingung: Das „Eiserne Gesetz“ ist in jede Aufgabenverteilung eingebaut: kein Produktionscode ohne zuerst einen fehlschlagenden Test. Der Prompt listet exakte Rationalisierungen auf, die Claude verwendet, um Tests zu überspringen („Das ist nur eine Konfigurationsänderung“, „Die bestehenden Tests decken das bereits ab“) und markiert sie als bekannte Ausreden.

Separate Agentenkontexte: Überprüfungen laufen in einem separaten Agentenkontext, in dem der Reviewer die Begründung des Executors nie sieht – nur den Diff und die Aufgabenspezifikation. Dies verhindert Abnick-Genehmigungen und hilft, echte Fehler zu erkennen.

Debugger-Agent: Wenn eine Aufgabe dreimal fehlschlägt, wird anstelle eines weiteren Versuchs ein Debugger-Agent eingesetzt. Dieser separate Agent reproduziert den Fehler, bildet Hypothesen, testet sie, identifiziert, wo die Korrektur erfolgen soll, und liefert dann die Ergebnisse an den Executor.

Abhängigkeitsverfolgung: Wenn eine Aufgabe eine API-Signatur ändert, wird alles Nachgelagerte automatisch ungültig gemacht und erneut in die Warteschlange gestellt.

Technische Details

Das System verwendet 6 Befehle, 4 Agenten und 11 MCP-Tools. Der Zustand wird in einer JSON-Datei verwaltet, mit Schema-Validierung und Versionskonflikten, die über optimistische Nebenläufigkeit behandelt werden.

Warum nicht die Originalversion

Die erste Version hatte 32 Befehle, 12 Agenten, über 100 Quelldateien und einen 2400-Zeilen-Installer. Der Autor hat sie verworfen und von Grund auf neu geschrieben, weil der größte Teil dieser Komplexität den Kontextfenster verbrauchte, ohne Mehrwert zu bieten.

Unerwartete Erkenntnisse

Der Anti-Rationalisierungs-Ansatz funktioniert – das Auflisten spezifischer Phrasen, die Claude verwendet, um Schritte zu überspringen, direkt im Agenten-Prompt reduzierte die Überspringrate. Der Autor stellt fest, dass negative Beispiele das Modell besser lenken als nur zu sagen „schreibe immer Tests“. Sitzungspersistenz war die schwierigste Implementierungsherausforderung.

📖 Read the full source: r/ClaudeAI