MAGELLAN: Un sistema autónomo de descubrimiento científico con 15 agentes construido sobre Claude Code

Arquitectura del Sistema e Implementación
MAGELLAN está construido completamente en Claude Code con 15 agentes personalizados definidos en .claude/agents/, coordinados por un orquestador. El sistema utiliza fijación de modelos: cada agente tiene model: opus o model: sonnet en el frontmatter para garantizar niveles de esfuerzo independientemente de la configuración de sesión.
Opus maneja razonamiento profundo entre dominios a través de cuatro agentes: Explorador, Generador, Crítico y Puerta de Calidad. Sonnet maneja tareas estructuradas a través de tres agentes: Explorador de Literatura, Clasificador y Validador Computacional.
Flujo de Trabajo y Patrones
El orquestador (Opus con interruptor de circuito de 200 turnos) distribuye a los subagentes y nunca ejecuta fases en línea. El sistema implementa bucles de reflexión mediante prompts de agentes: AUTO-CRÍTICA (Generador), META-CRÍTICA (Crítico) y VERIFICACIÓN DE CALIDAD OBJETIVO (Explorador).
Los ciclos adaptativos se ajustan según los resultados: finalización temprana si las 3 mejores hipótesis tienen puntuación >= 7.0, extensión al ciclo 3 si la tasa de supervivencia es < 30%. Después del pipeline, ocurre validación entre modelos mediante scripts bash que llaman a las APIs de GPT-5.4 y Gemini 3.1 para revisión independiente.
Resultados y Disponibilidad
Después de 19 sesiones, el sistema ha propuesto aproximadamente 260 hipótesis, con alrededor del 60% eliminadas por el pipeline adversario. Todos los resultados están disponibles en el sitio web del proyecto con metodología completa.
El sistema es de código abierto bajo licencia Apache 2.0. Los detalles del pipeline de Claude Code, descubrimientos e información de contribución están disponibles a través de los enlaces del proyecto.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Seis Repositorios de GitHub para el Desarrollo de Código con Claude
Un usuario de Reddit probó y compartió seis repositorios de GitHub diseñados para mejorar proyectos de Claude Code, incluyendo herramientas para desarrollo estructurado, generación de interfaz de usuario, gestión de tareas, memoria, exploración del ecosistema y automatización de flujos de trabajo.

Vigil: Un Sistema de Identificación Criptográfico para Agentes OpenClaw para Prevenir el Bloqueo
Un desarrollador que ejecuta agentes OpenClaw ha identificado que el tráfico anónimo de agentes está siendo bloqueado cada vez más por los sitios, y propone Vigil, un sistema de inicio de sesión que proporciona a los agentes identificadores criptográficos para construir reputación y evitar bloqueos indiscriminados.

OnPrem.LLM AgentExecutor: Lanza Agentes de IA en Sandbox con Herramientas Integradas
El AgentExecutor de OnPrem.LLM te permite crear agentes de IA autónomos que ejecutan tareas complejas utilizando modelos en la nube o locales, con nueve herramientas integradas que incluyen operaciones de archivos, comandos de shell y búsqueda web. Puedes ejecutar agentes en contenedores aislados por seguridad.

Perfilador de Costos de LLM: Herramienta de código abierto que monitorea el gasto en API para justificar el uso de modelos locales.
LLM Cost Profiler es una herramienta de Python que rastrea cada llamada API a OpenAI/Anthropic, mostrando exactamente en qué y dónde estás gastando. Expone tareas que son demasiado caras en relación con su complejidad, proporcionando cantidades concretas en dólares para justificar el cambio a modelos locales.