Agent-Xray: Herramienta de código abierto para depurar fallos de agentes de IA a partir de registros de seguimiento.

Agent-Xray es una herramienta de código abierto para depurar agentes de IA mediante el análisis de sus registros de seguimiento. Se creó para resolver el problema de agentes que fallan en tareas sin errores claros, situaciones en las que el código se ejecuta correctamente pero el agente toma decisiones incorrectas, como llamar repetidamente a la herramienta equivocada a pesar de que los mensajes de error sugieren la correcta.
Características Principales
La herramienta lee los registros de seguimiento y proporciona calificación estructural y clasificación de causas raíz para los fallos de los agentes. Reconstruye lo que el agente estaba viendo en cada paso para ayudar a comprender por qué se tomaron malas decisiones.
Categorías de Fallos
- spin
- tool_bug
- early_abort
Modo de Aplicación
La característica más significativa según el creador es el modo de aplicación. Después de corregir un error del agente, este modo ejecuta desafíos adversarios contra tus correcciones para verificar que sean legítimas. Verifica:
- Retornos codificados
- Aserciones debilitadas
Esto aborda el problema donde las correcciones pueden funcionar en tareas de prueba específicas pero en realidad son frágiles, o donde los agentes aprenden a manipular la prueba.
Integración en el Flujo de Trabajo
La herramienta se ejecuta como herramientas MCP, permitiendo que Claude Code la use directamente. Un flujo de trabajo típico descrito en la fuente:
- Indica a Claude Code que clasifique los seguimientos del agente
- Encuentra el peor fallo
- Reproduce lo que el agente vio
- Sugiere una corrección
- El modo de aplicación verifica que la corrección sea legítima
El creador describe esto como "agentes depurando agentes".
Detalles Técnicos
- Instalación:
pip install agent-xray - Inicio rápido:
agent-xray quickstart(incluye seguimientos de ejemplo para probar sin tus propios datos) - Licencia: MIT
- Cero dependencias
- Se ejecuta sin conexión
- Funciona con seguimientos de OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
- Antigüedad del proyecto: Aproximadamente 9 días al momento de la publicación
Caso de Uso
Esta herramienta es para desarrolladores que trabajan con agentes de IA y necesitan depurar fallos que no producen errores tradicionales o seguimientos de pila, situaciones en las que los agentes toman decisiones incorrectas a pesar de tener acceso a herramientas e información correctas.
📖 Read the full source: r/ClaudeAI
👀 Ver también

MoltPoker.xyz: Texas Hold'em con dinero ficticio para Agentes de IA
MoltPoker.xyz es una plataforma donde los agentes de IA pueden jugar al Texas Hold'em Sin Límite entre sí utilizando conexiones WebSocket, con manos reproducibles y razonamiento de agentes visible durante los juegos en vivo.

Capa de memoria autoalojada para Claude se ejecuta gratis en Cloudflare
Un servidor MCP de Cloudflare Worker permite a Claude recordar y recuperar notas mediante búsqueda semántica usando Workers AI y Vectorize, todo en el nivel gratuito.

git-prism v0.9.0: Proporciona Diffs Estructurados a Agentes de Codificación de IA mediante MCP
git-prism es un servidor MCP que reemplaza el texto diff de git con JSON estructurado para agentes de IA.

Tendr Skill Agrega Memoria a Largo Plazo Basada en CLI con Jerarquía para Reducir el Uso de Tokens
Una nueva habilidad de OpenClaw separa el razonamiento de la ejecución para operaciones de memoria a largo plazo, utilizando una herramienta CLI para manejar cambios estructurales de manera determinista. Admite wikilinks y jerarquía semántica explícita entre archivos para reducir el consumo de tokens y evitar la acumulación de errores.