Agent-Xray : déboguer les défaillances des agents IA open-source

Agent-Xray est un outil open-source pour déboguer les agents IA en analysant leurs journaux de traces. Il a été créé pour résoudre le problème des agents qui échouent à des tâches sans erreurs claires - des situations où le code s'exécute correctement mais l'agent prend de mauvaises décisions, comme appeler à plusieurs reprises le mauvais outil malgré des messages d'erreur suggérant le bon.

Fonctionnalités principales

L'outil lit les journaux de traces et fournit une évaluation structurelle et une classification des causes profondes des échecs des agents. Il reconstruit ce que l'agent voyait à chaque étape pour aider à comprendre pourquoi de mauvaises décisions ont été prises.

Catégories d'échec

spin
tool_bug
early_abort

Mode d'application

La fonctionnalité la plus importante selon le créateur est le mode d'application. Après avoir corrigé un bogue d'agent, ce mode exécute des défis adverses contre vos correctifs pour vérifier qu'ils sont légitimes. Il vérifie :

Les retours codés en dur
Les assertions affaiblies

Cela résout le problème où les correctifs pourraient fonctionner sur des tâches de test spécifiques mais sont en réalité fragiles, ou où les agents apprennent à contourner le test.

Intégration au flux de travail

L'outil s'exécute en tant qu'outils MCP, permettant à Claude Code de l'utiliser directement. Un flux de travail typique décrit dans la source :

Demander à Claude Code de trier les traces des agents
Il trouve l'échec le plus grave
Rejoue ce que l'agent a vu
Suggère un correctif
Le mode d'application vérifie que le correctif est légitime

Le créateur décrit cela comme "des agents qui déboguent des agents".

Détails techniques

Installation : pip install agent-xray
Démarrage rapide : agent-xray quickstart (inclut des traces d'exemple pour tester sans vos propres données)
Licence : MIT
Zéro dépendance
Fonctionne hors ligne
Fonctionne avec OpenAI, Anthropic, LangChain, CrewAI, traces OpenTelemetry
Âge du projet : Environ 9 jours au moment de la publication

Cas d'utilisation

Cet outil est destiné aux développeurs travaillant avec des agents IA qui doivent déboguer des échecs qui ne produisent pas d'erreurs ou de traces d'appel traditionnelles - des situations où les agents prennent des décisions incorrectes malgré l'accès aux bons outils et informations.

📖 Read the full source: r/ClaudeAI

Agent-Xray : Outil open-source pour déboguer les défaillances des agents IA à partir des journaux de traces

Fonctionnalités principales

Catégories d'échec

Mode d'application

Intégration au flux de travail

Détails techniques

Cas d'utilisation

👀 See Also

OpenClaw-WebTop : Exécutez OpenClaw avec Ollama et Ubuntu Desktop dans GitHub Codespaces

Plugin Quick-Question Automatise le Développement Unity avec Claude Code

Le compilateur SMELT réduit l'utilisation des jetons d'espace de travail OpenClaw jusqu'à 95 %

CC-Canary : Détectez les régressions dans Claude Code grâce à une analyse JSONL locale