GSD-Lite: Ein Zustandsautomat für Claude-Code, der TDD erzwingt und das Überspringen von Tests verhindert

GSD-Lite ist ein Open-Source-MCP-Server, der sich an Claude Code ankoppelt und Projekte durch einen 12-Zustands-Workflow-Automaten laufen lässt. Das Tool ist unter der MIT-Lizenz verfügbar und besteht insgesamt aus etwa 15 Quelldateien.
Wie es funktioniert
Nachdem in einem Gespräch mit Claude geplant wurde, was gebaut werden soll, übernimmt GSD-Lite automatisch: Code schreiben, überprüfen, verifizieren, zur nächsten Phase übergehen. Die Ausführungsschleife folgt diesem Muster:
- Orchestrator wählt nächste Aufgabe
- Executor schreibt Code (TDD, Checkpoint)
- Reviewer prüft (separater Kontext, Spezifikation + Qualität)
- Akzeptiert? Nächste Aufgabe. Abgelehnt? Überarbeitung.
- Alle Aufgaben erledigt? Phasentor-Prüfung
- Tor bestanden? Nächste Phase
- Alle Phasen erledigt? Fertig
Hauptmerkmale
TDD-Erzwingung: Das „Eiserne Gesetz“ ist in jede Aufgabenverteilung eingebaut: kein Produktionscode ohne zuerst einen fehlschlagenden Test. Der Prompt listet exakte Rationalisierungen auf, die Claude verwendet, um Tests zu überspringen („Das ist nur eine Konfigurationsänderung“, „Die bestehenden Tests decken das bereits ab“) und markiert sie als bekannte Ausreden.
Separate Agentenkontexte: Überprüfungen laufen in einem separaten Agentenkontext, in dem der Reviewer die Begründung des Executors nie sieht – nur den Diff und die Aufgabenspezifikation. Dies verhindert Abnick-Genehmigungen und hilft, echte Fehler zu erkennen.
Debugger-Agent: Wenn eine Aufgabe dreimal fehlschlägt, wird anstelle eines weiteren Versuchs ein Debugger-Agent eingesetzt. Dieser separate Agent reproduziert den Fehler, bildet Hypothesen, testet sie, identifiziert, wo die Korrektur erfolgen soll, und liefert dann die Ergebnisse an den Executor.
Abhängigkeitsverfolgung: Wenn eine Aufgabe eine API-Signatur ändert, wird alles Nachgelagerte automatisch ungültig gemacht und erneut in die Warteschlange gestellt.
Technische Details
Das System verwendet 6 Befehle, 4 Agenten und 11 MCP-Tools. Der Zustand wird in einer JSON-Datei verwaltet, mit Schema-Validierung und Versionskonflikten, die über optimistische Nebenläufigkeit behandelt werden.
Warum nicht die Originalversion
Die erste Version hatte 32 Befehle, 12 Agenten, über 100 Quelldateien und einen 2400-Zeilen-Installer. Der Autor hat sie verworfen und von Grund auf neu geschrieben, weil der größte Teil dieser Komplexität den Kontextfenster verbrauchte, ohne Mehrwert zu bieten.
Unerwartete Erkenntnisse
Der Anti-Rationalisierungs-Ansatz funktioniert – das Auflisten spezifischer Phrasen, die Claude verwendet, um Schritte zu überspringen, direkt im Agenten-Prompt reduzierte die Überspringrate. Der Autor stellt fest, dass negative Beispiele das Modell besser lenken als nur zu sagen „schreibe immer Tests“. Sitzungspersistenz war die schwierigste Implementierungsherausforderung.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

ClawControl 1.7.1 verbessert die Nachrichten-Zuverlässigkeit und Medienunterstützung für OpenClaw.
ClawControl 1.7.1 behebt mehrere clientseitige Probleme, darunter unkontrollierte Textakkumulation, Geister-Nachrichten und Medienverarbeitungsprobleme. Das Update behält die Kompatibilität mit OpenClaw bis Version 3.28 bei.

civStation: Ein VLM-System zum Spielen von Civilization VI über natürliche Sprachbefehle
civStation ist ein VLM-System zur Computernutzung, das Civilization VI spielt, indem es hochrangige natürliche Sprachbefehle in Spielaktionen übersetzt. Das System verwendet eine 3-Schichten-Architektur, die Strategie und Ausführung trennt, mit Unterstützung für menschliche Eingriffe.

Ein geologisches Uhrwerk mit Claude Code erstellen: Single HTML + Three.js
Ein Produktdesigner hat eona.earth entwickelt, eine geologische Uhr, die die 4,5 Milliarden Jahre der Erde auf 12 Stunden abbildet. Dafür nutzte er Claude Code, Three.js und benutzerdefinierte WebGL-Shader – alles als einzelne HTML-Datei ohne Build-Schritt.

Verbesserung der Claude-Code-Sitzungen mit claude-self-improve
Claude-self-improve ist ein CLI-Tool, das die AI-Leistung von Claude Code verbessert, indem es Sitzungsdaten analysiert und Speicherdateien automatisch aktualisiert.