Reproduction du harnais générateur-évaluateur d'Anthropic avec Kiro CLI : Construction d'un site web en 12 itérations

✍️ OpenClawRadar📅 Publié: May 17, 2026🔗 Source
Reproduction du harnais générateur-évaluateur d'Anthropic avec Kiro CLI : Construction d'un site web en 12 itérations
Ad

Un développeur a reproduit le concept du Générateur-Évaluateur d'Anthropic pour des applications longues, inspiré des GAN. L'architecture : un Planificateur (exécuté une fois) puis une boucle Générateur ↔ Évaluateur pendant 12 itérations. Chaque agent est un processus CLI distinct sans contexte partagé, communiquant uniquement via des fichiers (spec.md, eval-report.md). L'Évaluateur utilise Playwright pour naviguer sur le site en direct, pas seulement lire le code.

Détails clés de l'architecture

  • Page blanche à chaque invocation : Chaque agent démarre à zéro, ne lit que ses fichiers d'entrée. Évite l'anxiété de contexte.
  • Playwright MCP pour les tests : Navigue, clique, redimensionne les fenêtres. Détecte les bugs visuels qu'une revue de code ne verrait jamais.
  • Compétence en design frontend d'Anthropic : Pénalise explicitement les motifs génériques de l'IA (police Inter, dégradés violets, dispositions en cartes). Force la prise de risque créative.
  • Itération continue, pas de réessai en cas d'échec : Les 12 tours s'exécutent quoi qu'il arrive. Chacun apporte une amélioration.
Ad

Résultats et statistiques

Itération 1 : fonctionnelle mais oubliable. Itération 4 : le Générateur est passé à "Terminal Noir" — IBM Plex Mono, ambre sur fond noir, textures de grain, lignes de balayage. Itérations 5-12 : polissage, accessibilité, corrections responsives, prise en charge des mouvements réduits.

  • Temps total : 3 h 20 min
  • Itérations : 12 (générateur + évaluateur chacune)
  • Code écrit manuellement : 0 ligne (quelques problèmes visuels corrigés après)
  • Technologies : Next.js, Tailwind, Framer Motion, TypeScript

Résultat en direct

https://mnemo-mcp.github.io/Mnemo/

Enseignement clé

Le modèle est le moteur. Le harnais — contraintes, boucles de rétroaction et structure adversariales — détermine si vous obtenez du brouet IA ou quelque chose de vraiment distinctif.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Claude Code Utilisé pour Rétro-ingénier Disney Infinity 1.0, Brisant la Restriction de 13 Ans sur les Personnages
Use Cases

Claude Code Utilisé pour Rétro-ingénier Disney Infinity 1.0, Brisant la Restriction de 13 Ans sur les Personnages

Un développeur a utilisé Claude Code (Opus 4.6 avec raisonnement élevé) pour rétroconcevoir le binaire du jeu Disney Infinity 1.0, identifiant et corrigeant 13 sites d'appel de validation qui empêchaient les personnages de jouer dans n'importe quel set de jeu. La solution a nécessité 17 correctifs binaires et 3 fichiers de données modifiés, résolvant un problème que la communauté de modding n'avait pas pu résoudre pendant plus d'une décennie.

OpenClawRadar
Exécuter Gemma 4 en tant qu'agent autonome local avec Claude Code sur 16 Go de VRAM
Use Cases

Exécuter Gemma 4 en tant qu'agent autonome local avec Claude Code sur 16 Go de VRAM

Un développeur a réussi à configurer le modèle Gemma 4 31B de Google pour fonctionner comme un agent de codage autonome local via Claude Code CLI v2.1.92, surmontant les limitations de VRAM et les problèmes d'analyse en utilisant llama.cpp b8672 et un routage Python personnalisé.

OpenClawRadar
Développeur crée le jeu textuel Track Star avec Claude comme partenaire de codage
Use Cases

Développeur crée le jeu textuel Track Star avec Claude comme partenaire de codage

Un développeur a utilisé Claude comme principal partenaire de codage pour créer Track Star, un jeu de simulation de carrière d'athlétisme en mode texte, comblant ses lacunes en Python pendant des soirées et des week-ends sur plusieurs mois. La démo finalisée a été lancée sur Steam la semaine dernière.

OpenClawRadar
Utiliser Claude pour construire un moteur de recherche structuré de Pokémon à partir de texte non structuré du Pokédex
Use Cases

Utiliser Claude pour construire un moteur de recherche structuré de Pokémon à partir de texte non structuré du Pokédex

Un développeur a utilisé Claude pour analyser plus de 500 000 mots de texte non structuré du Pokédex Pokémon, créant un moteur de recherche avec plus de 100 thèmes et un filtrage à 8 dimensions. Le projet a impliqué la déduplication, la catégorisation et la construction d'une taxonomie hiérarchique pour des textes descriptifs désorganisés.

OpenClawRadar