4 agents d'IA construisent une bibliothèque C++20

Le Projet et le Pipeline

Le développeur a construit FAT-P, une bibliothèque C++20 uniquement composée d'en-têtes avec 107 fichiers d'en-tête et zéro dépendance externe. 62 composants ont été évalués par rapport à Boost, Abseil, LLVM et EASTL, avec des performances compétitives ou plus rapides sur la plupart des opérations.

Le pipeline de développement utilisait quatre agents d'IA avec des rôles distincts :

Même spécification donnée aux quatre indépendamment
Revue croisée entre les agents
Fusion et implémentation
Un autre tour de revue parallèle
Réinitialisation du contexte et revue fraîche avec seulement les directives et le code (aucun biais accumulé des conversations de développement)

Rôles et Performances des Agents d'IA

Claude a servi d'architecte principal : a conçu les composants, rédigé les documents de gouvernance, implémenté le code et maintenu les standards pendant des mois de développement.

ChatGPT était le meilleur réviseur : adversaire et axé sur les contre-exemples. A trouvé 12+ bugs réels dans FastHashMap seul, incluant un bug de miroir d'octet de contrôle causant des boucles infinies, un comportement indéfini 32-bit dans le finaliseur de hachage, et des problèmes de terminaison de sonde.

Gemini a examiné StableHashMap et a suggéré trois optimisations qui existaient déjà dans le code. Il a ensuite implémenté un allocateur de blocs ignorant celui existant, causant une régression de 3.6x sur les performances des échecs. Cet échec est documenté dans le matériel pédagogique comme une étude de cas nommée.

Grok a contribué l'abstraction de politique d'allocateur (HeapAllocator vs FixedAllocator), qui était architecturalement solide et a été intégrée dans la conception finale.

Rôle Humain et Système de Gouvernance

Le rôle humain était la direction et le jugement : accepter, rejeter, signaler. Pas l'implémentation, l'architecture ou la gouvernance. Le système de directives (3.7 versions d'un document régissant le comportement de l'IA, les conventions de nommage, les protocoles de revue, les standards de documentation, l'architecture en couches) a été écrit par l'IA pour contraindre les futures instances d'IA.

L'IA a écrit des règles pour se contraindre elle-même. Un suivi des démérites enregistre les violations par l'IA et par type :

Claude a 10 démérites pour ne pas avoir lu attentivement les directives
ChatGPT a 10 pour avoir livré du code corrompu, 10 pour ne pas avoir implémenté les changements requis

Les démérites ne sont pas punitifs — ils encodent les modes d'échec dans le système de gouvernance pour que les futures instances ne les répètent pas.

La Règle du Pansement existe parce que Claude et ChatGPT ont indépendamment manifesté la même pathologie sur le même bug — les deux ont identifié la correction structurelle correcte, les deux ont livré une atténuation moins coûteuse et ont présenté la vraie correction comme optionnelle. La règle dit maintenant : si vous connaissez la cause racine, corrigez la cause racine.

Test et Découverte Clé

Dans un test, Claude a reçu les directives FAT-P et a été invité à construire un Système d'Entités-Composants (ECS) en utilisant les composants FAT-P. Pas de pipeline à 4 IA, pas de revue parallèle, une seule session.

Claude a lu les directives, a correctement identifié ce qui était transférable à un projet consommateur et ce qui ne l'était pas, a rédigé son propre document de directives de développement adapté pour le nouveau projet, puis a produit 19 fichiers d'en-tête avec une parité complète de l'API EnTT, 539 tests répartis sur 18 suites, et des benchmarks compétitifs avec EnTT à 1M entités. Le code était stylistiquement cohérent à travers chaque fichier.

La découverte clé : encodez le jugement dans des directives avec une IA, et cette IA devient autonome dans l'espace que ce jugement définit. Elle prend possession, maintient les standards et s'étend correctement à de nouveaux contextes sans qu'on lui dise comment. L'humain fournit les idées et le jugement ; l'IA fournit la capacité de maintenir ce jugement de manière cohérente à grande échelle sans dérive.

📖 Lire la source complète : r/LocalLLaMA

Étude de cas : Utiliser plusieurs agents d'IA pour construire une bibliothèque C++ de production

Le Projet et le Pipeline

Rôles et Performances des Agents d'IA

Rôle Humain et Système de Gouvernance

Test et Découverte Clé

👀 See Also

Designer crée une application native Mac pour étiqueter des photos avec Claude Code et un modèle de vision local

Création d'agents d'IA auto-réparateurs pour les systèmes de production.

Limites pratiques des stations de travail IA multi-GPU : Leçons tirées d'une configuration à 9 × RTX 3090

Système autonome à 5 agents Claude remplace des coûts d'API de 3 000 $/mois par un seul abonnement