Un flux de développement TDD utilisant des agents IA pour des projets de site web

Flux de travail de développement avec des agents d'IA
Un développeur décrit son approche du développement de sites web en utilisant des agents d'IA de codage avec une méthodologie de développement piloté par les tests. Il utilise à la fois Claude Code pour les projets professionnels et des modèles locaux pour les projets privés, spécifiquement Qwen Code sur Qwen3.5-27B exécuté sur llama.cpp avec 2 cartes graphiques RTX 3090.
Configuration initiale du projet
Au début d'un projet, ils implémentent des modules de base :
- Schéma de base de données de base
- API d'authentification de base
- Routage de l'interface utilisateur
- Mise en page de base de l'interface utilisateur
- API de base (administrateurs et utilisateurs)
- Tests API/E2E de base (écrits manuellement ou par IA)
- Fichiers de contexte pour les agents de codage (AGENTS.md, CLAUDE.md)
Processus de développement itératif
Après la configuration, le processus itératif commence :
- Écrire des spécifications détaillées des tests API/E2E en markdown pour une fonctionnalité
- Générer des tests API/E2E à partir des descriptions de tests en markdown
- Démarrer une session d'agent de codage avec la capacité d'exécuter des tests
- Demander à l'agent d'implémenter la fonctionnalité jusqu'à ce que les tests réussissent
Capacités et compromis des modèles
Le développeur note que les modèles plus performants comme Claude permettent de sauter complètement les fichiers markdown pour des sites web simples, tandis que Qwen3.5-27B a des seuils différents. Les modèles moins performants nécessitent des instructions plus spécifiques pour atténuer les modes d'échec, notamment en verrouillant la logique en indiquant de ne pas toucher certains fichiers ou en utilisant uniquement des wrappers spécifiques.
Ils émettent l'hypothèse que les développeurs ne devraient pas être obsédés par les modèles de code et la qualité si le code est couvert par des tests et fonctionne, comparant les agents d'IA à la gestion de 10 à 100 développeurs juniors/intermédiaires au coût d'un abonnement d'IA.
Spécificités des modèles locaux
Pour les modèles locaux fonctionnant sur 2xRTX3090, ils utilisent Qwen3.5-27B-GGUF-Q8_0 avec parallel = 1 et contexte complet, estimant que c'est important pour que les sessions d'agents ne soient pas compressées automatiquement prématurément. Ils notent que les modèles moins intelligents forcent une articulation plus claire des tests E2E et de l'implémentation souhaitée, tandis que Claude comble automatiquement les choix de conception mais peut entraîner une perte de contrôle.
Implémentation de la boucle TDD de codage
Le développeur fournit un projet de sa boucle TDD de codage :
outer loop begins: run all pytest tests using command `pytest tests/ -x` and will exit there aren't any failures; the default loglevel will be warning, so not much output there
if everything passes; exit the outer loop; if something failed, extracts failed test name
runs the failed test name with full logs, like `pytest tests/../test_first_failing_test.py --log-level DEBUG` and collects the output of the tests into the file
extracts lines near the 'error'/'fail' strings with `egrep -i -C 10 '(error|fail)' <failCette approche représente une implémentation pratique du TDD avec des agents d'IA, équilibrant l'automatisation avec la supervision nécessaire pour maintenir le contrôle de la base de code.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Utilisation de la version gratuite de Claude pour mettre à jour automatiquement les bases de données de recherche Notion
Un développeur a créé un système utilisant la version gratuite de Claude pour structurer et sauvegarder automatiquement des recherches dans des bases de données Notion. Le flux de travail prend des notes de recherche brutes et les formate en entrées de base de données structurées avec des champs, catégories et résumés cohérents.

Comment les agents d'IA appliquent systématiquement les principes cognitifs dans les flux de travail de développement
Les agents d'IA peuvent opérationnaliser quatre couches de principes cognitifs — fondements épistémiques, principes d'exécution, principes de levier et conception de systèmes — avec une cohérence implacable dans les tâches de gouvernance personnelle, à but non lucratif et communautaire.

Découpler la narration du suivi d'état corrige l'amnésie des jeux d'aventure textuels en IA
Un développeur a créé un moteur de simulation avec état où PostgreSQL suit l'état du jeu et les LLM ne génèrent du texte narratif qu'après les changements d'état, évitant ainsi les hallucinations d'inventaire et la perte de l'intrigue.

La configuration multi-agent déclenche des frais de 3 400 $ en raison d'une boucle d'hallucination.
Un développeur a codé en dur une carte virtuelle d'entreprise dans les variables d'environnement pour tester une configuration multi-agents MCP, ce qui a entraîné des frais de 3 400 $ lorsqu'un agent principal s'est retrouvé bloqué dans une boucle d'hallucination qui a lancé de nouvelles instances de proxy payantes toutes les 45 secondes pendant 14 heures.