MAGELLAN : Un système de découverte scientifique autonome à 15 agents construit sur Claude Code

Architecture du système et mise en œuvre
MAGELLAN est entièrement construit sur Claude Code avec 15 agents personnalisés définis dans .claude/agents/, coordonnés par un orchestrateur. Le système utilise l'épinglage de modèle : chaque agent a model: opus ou model: sonnet dans le frontmatter pour garantir des niveaux d'effort indépendants des paramètres de session.
Opus gère le raisonnement approfondi interdomaines à travers quatre agents : Scout, Générateur, Critique et Porte de Qualité. Sonnet gère les tâches structurées à travers trois agents : Scout Littéraire, Classificateur et Validateur Computationnel.
Flux de travail et modèles
L'orchestrateur (Opus avec un disjoncteur à 200 tours) répartit les tâches aux sous-agents et n'exécute jamais les phases en ligne. Le système implémente des boucles de réflexion via des invites d'agents : AUTO-CRITIQUE (Générateur), MÉTA-CRITIQUE (Critique) et CONTRÔLE DE QUALITÉ CIBLE (Scout).
Les cycles adaptatifs s'ajustent en fonction des résultats : achèvement anticipé si les 3 meilleures hypothèses atteignent un score ≥ 7.0, prolongation jusqu'au cycle 3 si le taux de survie est < 30%. Après le pipeline, une validation inter-modèles se produit via des scripts bash appelant les API GPT-5.4 et Gemini 3.1 pour une revue indépendante.
Résultats et disponibilité
Après 19 sessions, le système a proposé environ 260 hypothèses, avec environ 60% éliminées par le pipeline contradictoire. Tous les résultats sont disponibles sur le site web du projet avec la méthodologie complète.
Le système est open source sous licence Apache 2.0. Les détails du pipeline Claude Code, les découvertes et les informations de contribution sont disponibles via les liens du projet.
📖 Read the full source: r/ClaudeAI
👀 See Also

Vibeyard ajoute un tableau Kanban pour gérer plusieurs sessions Claude Code
Un IDE open-source appelé Vibeyard inclut désormais un tableau Kanban qui permet de lancer des sessions d'agent Claude Code directement depuis les cartes. Les cartes se déplacent automatiquement vers la colonne Terminé lorsque l'agent a fini.

Utilisation de Claude pour automatiser le contrôle qualité d'applications mobiles avec les WebViews Capacitor
Un développeur a créé un système de QA automatisé utilisant Claude pour tester une application mobile basée sur Capacitor sur Android et iOS. L'approche utilise le Chrome DevTools Protocol pour les WebViews Android et des captures d'écran pour l'analyse visuelle, avec une configuration Android prenant 90 minutes contre plus de 6 heures pour iOS.

ClaudeHive : Interface Web pour Gérer des Sessions de Code Claude en Parallèle
ClaudeHive est une interface web qui gère des sessions parallèles de Claude Code, permettant aux utilisateurs de définir des modèles de prompts avec des espaces réservés, de les exécuter par lots sur plusieurs entrées avec une concurrence configurable, et de consulter tous les résultats en un seul endroit. Il inclut un outil CLI pour que les agents gestionnaires puissent créer et coordonner des agents travailleurs.

7 commandes slash, 0,45 $/article : Ce pipeline Claude Code exécute une opération complète de contenu SEO
Un développeur a open-sourcé un pipeline Claude Code en 7 commandes qui gère la recherche SEO, la rédaction, l'optimisation et la publication. Coût : 0,45 $/article (API Perplexity), exécution en 15 min/jour. Résultats : 18× d'impressions mensuelles en 12 mois.