Agent-Xray: Depura fallos de agentes de IA con código abierto

Agent-Xray es una herramienta de código abierto para depurar agentes de IA mediante el análisis de sus registros de seguimiento. Se creó para resolver el problema de agentes que fallan en tareas sin errores claros, situaciones en las que el código se ejecuta correctamente pero el agente toma decisiones incorrectas, como llamar repetidamente a la herramienta equivocada a pesar de que los mensajes de error sugieren la correcta.

Características Principales

La herramienta lee los registros de seguimiento y proporciona calificación estructural y clasificación de causas raíz para los fallos de los agentes. Reconstruye lo que el agente estaba viendo en cada paso para ayudar a comprender por qué se tomaron malas decisiones.

Categorías de Fallos

spin
tool_bug
early_abort

Modo de Aplicación

La característica más significativa según el creador es el modo de aplicación. Después de corregir un error del agente, este modo ejecuta desafíos adversarios contra tus correcciones para verificar que sean legítimas. Verifica:

Retornos codificados
Aserciones debilitadas

Esto aborda el problema donde las correcciones pueden funcionar en tareas de prueba específicas pero en realidad son frágiles, o donde los agentes aprenden a manipular la prueba.

Integración en el Flujo de Trabajo

La herramienta se ejecuta como herramientas MCP, permitiendo que Claude Code la use directamente. Un flujo de trabajo típico descrito en la fuente:

Indica a Claude Code que clasifique los seguimientos del agente
Encuentra el peor fallo
Reproduce lo que el agente vio
Sugiere una corrección
El modo de aplicación verifica que la corrección sea legítima

El creador describe esto como "agentes depurando agentes".

Detalles Técnicos

Instalación: pip install agent-xray
Inicio rápido: agent-xray quickstart (incluye seguimientos de ejemplo para probar sin tus propios datos)
Licencia: MIT
Cero dependencias
Se ejecuta sin conexión
Funciona con seguimientos de OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
Antigüedad del proyecto: Aproximadamente 9 días al momento de la publicación

Caso de Uso

Esta herramienta es para desarrolladores que trabajan con agentes de IA y necesitan depurar fallos que no producen errores tradicionales o seguimientos de pila, situaciones en las que los agentes toman decisiones incorrectas a pesar de tener acceso a herramientas e información correctas.

📖 Read the full source: r/ClaudeAI

Agent-Xray: Herramienta de código abierto para depurar fallos de agentes de IA a partir de registros de seguimiento.

Características Principales

Categorías de Fallos

Modo de Aplicación

Integración en el Flujo de Trabajo

Detalles Técnicos

Caso de Uso

👀 Ver también

MCP Server conecta Claude Code/Desktop a Apple Music — Listas de reproducción, Búsqueda, Análisis de perfil

El Hollow AgentOS reduce el uso de tokens de código de Claude en un 68.5% con un sistema operativo nativo en JSON para agentes de IA.

Piloto: Una Herramienta de Automatización de Navegador Construida Completamente con Código Claude

Vibeyard IDE agrega un navegador integrado para la edición directa de interfaces web con agentes de IA.