10 Jeux TypeScript par Prompts LLM : Étude de Cas

Vue d'ensemble du système et résultats

Un système multi-agents composé d'un orchestrateur Claude Opus et d'agents travailleurs Codex a réalisé 10 constructions logicielles entièrement autonomes sans intervention humaine. Le système a produit 10 jeux navigateur TypeScript totalisant plus de 50 000 lignes de code et des centaines de tests réussis.

L'orchestrateur—un LLM de pointe doté d'un prompt et d'un accès CLI—a décomposé les objectifs, dispatché des travailleurs parallèles, analysé les résultats, trié les erreurs et coordonné l'intégration. Aucun échafaudage programmatique, machine à états ou infrastructure de routage des tâches n'a été utilisé ; la logique d'orchestration est un prompt, pas un programme.

Principales conclusions de l'étude de cas

L'application du périmètre via des prompts échoue complètement sous pression du compilateur (0/20), tandis que l'application mécanique via une réversion a posteriori des fichiers est trivialement efficace (20/20)
Les contrats de type ne sont pas nécessaires pour l'intégration à toutes les échelles testées (6–36 modules) lorsque l'agent d'intégration dispose d'un accès d'édition illimité
L'orchestrateur a maintenu une continuité parfaite des tâches à travers 11 événements de compactage de contexte
L'analyse des coûts révèle une prime d'état : avec des taux de cache d'environ 95 %, la majorité du traitement de l'orchestrateur consiste à relire le contexte conversationnel précédent
Une ablation par prompt nu invalide l'affirmation forte que les modèles découvrent indépendamment des schémas de coordination, mais révèle que l'exécution solo surpasse les constructions coordonnées en dessous d'environ 30 000 lignes de code

Architecture du système et données

Le système utilise une architecture arborescente : un humain fournit des objectifs à un orchestrateur Claude Opus, qui décompose le travail en tâches parallèles dispatchées à des travailleurs Codex. Les travailleurs opèrent de manière totalement autonome et communiquent exclusivement via le système de fichiers.

Le jeu de données complet comprend :

10 sessions d'orchestrateur Claude (52 Mo)
88 sessions de travailleurs Codex (89 Mo)
62 journaux stdout des travailleurs (186,7 Mo, 6,1M lignes)
55 fichiers d'objectifs avec le texte complet des prompts
1 journal d'événements TUI (21 Mo, 173K lignes)

Corpus total : 295M de tokens à travers 88 sessions de travailleurs Codex et 10 sessions d'orchestrateur Claude.

Évolution du système

Le système a évolué à travers cinq phases sur environ six mois. L'opérateur a commencé avec un copier-coller manuel entre deux fenêtres de chat LLM, est passé à des outils CLI en terminal pour l'accès au système de fichiers, puis a construit un échafaudage programmatique avec mémoire et routage. L'échafaudage fonctionnait mais était fragile—chaque cas limite nécessitait du nouveau code. Une seule session Claude avec accès CLI l'a surpassé.

Le système résultant, orch-minimal, conserve 62 792 lignes de code de support, mais la logique d'orchestration centrale est un prompt, pas un programme.

📖 Lire la source complète : r/LocalLLaMA

Étude de cas : Utilisation de prompts LLM au lieu d'échafaudages programmatiques pour les constructions logicielles multi-agents

Vue d'ensemble du système et résultats

Principales conclusions de l'étude de cas

Architecture du système et données

Évolution du système

👀 See Also

Limites pratiques des stations de travail IA multi-GPU : Leçons tirées d'une configuration à 9 × RTX 3090

Examen de sécurité multi-agent exécuté quotidiennement en production : architecture et résultats

Les non-développeurs créent des outils de narration astrologique avec l'API Claude.

Projet James Sexton : Développer un assistant juridique avec OpenClaw et Claude