GSD-Lite : Une machine à états pour le code Claude qui impose le TDD et empêche le contournement des tests

GSD-Lite est un serveur MCP open-source qui se greffe à Claude Code et fait passer les projets par une machine de workflow à 12 états. L'outil est sous licence MIT et comprend environ 15 fichiers source au total.
Fonctionnement
Après avoir planifié ce qu'il faut construire en conversation avec Claude, GSD-Lite prend automatiquement le relais : écrire le code, le revoir, le vérifier, passer à la phase suivante. La boucle d'exécution suit ce schéma :
- L'orchestrateur choisit la tâche suivante
- L'exécuteur écrit le code (TDD, point de contrôle)
- Le réviseur vérifie (contexte séparé, spécifications + qualité)
- Accepté ? Tâche suivante. Rejeté ? Retravailler.
- Toutes les tâches terminées ? Vérification de la porte de phase
- La porte passe ? Phase suivante
- Toutes les phases terminées ? C'est fini
Fonctionnalités clés
Application du TDD : La "Loi de fer" est intégrée à chaque distribution de tâche : pas de code de production sans un test en échec au préalable. L'invite liste les rationalisations exactes que Claude utilise pour sauter les tests ("Ce n'est qu'un changement de configuration", "Les tests existants couvrent déjà cela") et les signale comme des excuses connues.
Contextes d'agents séparés : Les revues s'exécutent dans un contexte d'agent séparé où le réviseur ne voit jamais le raisonnement de l'exécuteur—seulement le diff et les spécifications de la tâche. Cela évite les approbations automatiques et aide à détecter les vrais bugs.
Agent débogueur : Lorsqu'une tâche échoue 3 fois, au lieu d'une autre tentative, un agent débogueur est envoyé. Cet agent séparé reproduit l'échec, formule des hypothèses, les teste, identifie où la correction doit aller, puis fournit ses conclusions à l'exécuteur.
Suivi des dépendances : Si une tâche modifie la signature d'une API, tout ce qui en dépend est invalidé et remis en file d'attente automatiquement.
Détails techniques
Le système utilise 6 commandes, 4 agents et 11 outils MCP. L'état est géré dans un fichier JSON avec validation de schéma et les conflits de version gérés via un contrôle de concurrence optimiste.
Pourquoi pas la version originale
La première version avait 32 commandes, 12 agents, plus de 100 fichiers source et un installateur de 2400 lignes. L'auteur l'a jetée et a tout réécrit à partir de zéro car la plupart de cette complexité brûlait la fenêtre de contexte sans apporter de valeur.
Découvertes inattendues
L'approche anti-rationalisation fonctionne—lister des phrases spécifiques que Claude utilise pour sauter des étapes directement dans l'invite de l'agent a réduit le taux de saut. L'auteur note que les exemples négatifs semblent mieux guider le modèle que de simplement dire "toujours écrire des tests". La persistance de session a été le défi d'implémentation le plus difficile.
📖 Read the full source: r/ClaudeAI
👀 See Also

Qhatu : La plateforme transforme les dépôts GitHub en micro SaaS payants à l'usage avec Claude
Qhatu est une plateforme qui prend un dépôt GitHub et le déploie en tant que micro SaaS à l'usage avec paiement à l'utilisation, dotée d'une interface générée automatiquement et d'un traitement de paiement intégré. Le système utilise les API d'Anthropic pour analyser le code, générer des Dockerfiles et créer des interfaces de boutique en ligne.

idea-reality-mcp : Le serveur MCP vérifie l'existence des outils avant que Claude n'écrive le code
Un développeur a créé un serveur MCP appelé idea-reality-mcp qui analyse les dépôts GitHub, les discussions Hacker News, les packages npm et PyPI avant que Claude n'écrive du code, renvoyant un score de 'signal de réalité' de 0 à 100 indiquant la concurrence du marché.

Claude Sleuth : Un flux de travail d'investigation en 56 tâches pour Claude AI
Claude Sleuth est un flux de travail d'investigation structuré pour Claude AI avec 6 phases et 56 tâches, incluant un stockage d'état persistant via Cloudflare D1 et des conventions de sortie standardisées comprenant des horodatages ISO 8601, des enregistrements d'entités POLE et le langage de probabilité ICD 203.

Résumé de réunion sur un GPU 6 Go : qwen3.5:0.8B fonctionne en 57s, Granite 4 350M hallucine
VoiceFlow v1.6.0 ajoute l'enregistrement et le résumé de réunions en local. Benchmark de modèles sub-1B sur une RTX 3060 6GB : qwen3.5:0.8B produit des résumés structurés en 57s avec 2,2 Go de VRAM, tandis que Granite 4 350M hallucine gravement.