Étude de cas : Utilisation de prompts LLM au lieu d'échafaudages programmatiques pour les constructions logicielles multi-agents

✍️ OpenClawRadar📅 Publié: February 23, 2026🔗 Source
Étude de cas : Utilisation de prompts LLM au lieu d'échafaudages programmatiques pour les constructions logicielles multi-agents
Ad

Vue d'ensemble du système et résultats

Un système multi-agents composé d'un orchestrateur Claude Opus et d'agents travailleurs Codex a réalisé 10 constructions logicielles entièrement autonomes sans intervention humaine. Le système a produit 10 jeux navigateur TypeScript totalisant plus de 50 000 lignes de code et des centaines de tests réussis.

L'orchestrateur—un LLM de pointe doté d'un prompt et d'un accès CLI—a décomposé les objectifs, dispatché des travailleurs parallèles, analysé les résultats, trié les erreurs et coordonné l'intégration. Aucun échafaudage programmatique, machine à états ou infrastructure de routage des tâches n'a été utilisé ; la logique d'orchestration est un prompt, pas un programme.

Principales conclusions de l'étude de cas

  • L'application du périmètre via des prompts échoue complètement sous pression du compilateur (0/20), tandis que l'application mécanique via une réversion a posteriori des fichiers est trivialement efficace (20/20)
  • Les contrats de type ne sont pas nécessaires pour l'intégration à toutes les échelles testées (6–36 modules) lorsque l'agent d'intégration dispose d'un accès d'édition illimité
  • L'orchestrateur a maintenu une continuité parfaite des tâches à travers 11 événements de compactage de contexte
  • L'analyse des coûts révèle une prime d'état : avec des taux de cache d'environ 95 %, la majorité du traitement de l'orchestrateur consiste à relire le contexte conversationnel précédent
  • Une ablation par prompt nu invalide l'affirmation forte que les modèles découvrent indépendamment des schémas de coordination, mais révèle que l'exécution solo surpasse les constructions coordonnées en dessous d'environ 30 000 lignes de code
Ad

Architecture du système et données

Le système utilise une architecture arborescente : un humain fournit des objectifs à un orchestrateur Claude Opus, qui décompose le travail en tâches parallèles dispatchées à des travailleurs Codex. Les travailleurs opèrent de manière totalement autonome et communiquent exclusivement via le système de fichiers.

Le jeu de données complet comprend :

  • 10 sessions d'orchestrateur Claude (52 Mo)
  • 88 sessions de travailleurs Codex (89 Mo)
  • 62 journaux stdout des travailleurs (186,7 Mo, 6,1M lignes)
  • 55 fichiers d'objectifs avec le texte complet des prompts
  • 1 journal d'événements TUI (21 Mo, 173K lignes)

Corpus total : 295M de tokens à travers 88 sessions de travailleurs Codex et 10 sessions d'orchestrateur Claude.

Évolution du système

Le système a évolué à travers cinq phases sur environ six mois. L'opérateur a commencé avec un copier-coller manuel entre deux fenêtres de chat LLM, est passé à des outils CLI en terminal pour l'accès au système de fichiers, puis a construit un échafaudage programmatique avec mémoire et routage. L'échafaudage fonctionnait mais était fragile—chaque cas limite nécessitait du nouveau code. Une seule session Claude avec accès CLI l'a surpassé.

Le système résultant, orch-minimal, conserve 62 792 lignes de code de support, mais la logique d'orchestration centrale est un prompt, pas un programme.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Limites pratiques des stations de travail IA multi-GPU : Leçons tirées d'une configuration à 9 × RTX 3090
Use Cases

Limites pratiques des stations de travail IA multi-GPU : Leçons tirées d'une configuration à 9 × RTX 3090

Un développeur partage son expérience avec 9 GPU RTX 3090 pour le travail d'IA, constatant des rendements décroissants au-delà de 6 GPU et recommandant Proxmox pour l'expérimentation avec des LLM. Le RTX 3090 reste intéressant à 750 $ pour ses 24 Go de VRAM.

OpenClawRadar
Examen de sécurité multi-agent exécuté quotidiennement en production : architecture et résultats
Use Cases

Examen de sécurité multi-agent exécuté quotidiennement en production : architecture et résultats

ultrathink.art exécute plus de 6 agents IA en production, dont un agent de sécurité dédié qui effectue quotidiennement des vérifications de vulnérabilités selon une liste de contrôle structurée, classe les découvertes en tâches prioritaires et fait corriger automatiquement les problèmes par un agent de codage.

OpenClawRadar
Les non-développeurs créent des outils de narration astrologique avec l'API Claude.
Use Cases

Les non-développeurs créent des outils de narration astrologique avec l'API Claude.

Un non-développeur de 77 ans a créé Fortune Cast et Ember Cast en utilisant Claude comme principal collaborateur, produisant des récits astrologiques personnalisés basés sur les positions planétaires et les informations personnelles.

OpenClawRadar
Projet James Sexton : Développer un assistant juridique avec OpenClaw et Claude
Use Cases

Projet James Sexton : Développer un assistant juridique avec OpenClaw et Claude

Un développeur crée un assistant juridique utilisant OpenClaw et l'API Claude pour automatiser le traitement des documents lors d'un procès en divorce. Le système surveille les emails, télécharge les PDF, analyse les documents avec Claude, trouve les formulaires de réponse, génère des réponses et imprime les brouillons.

OpenClawRadar