Agente-Xray: Ferramenta Open Source para Depurar Falhas de IA

Agent-Xray é uma ferramenta de código aberto para depurar agentes de IA analisando seus logs de rastreamento. Foi criada para resolver o problema de agentes que falham em tarefas sem erros claros — situações em que o código é executado normalmente, mas o agente toma decisões erradas, como chamar repetidamente a ferramenta errada apesar de mensagens de erro sugerirem a correta.

Principais Recursos

A ferramenta lê logs de rastreamento e fornece classificação estrutural e de causa raiz para falhas de agentes. Ela reconstrói o que o agente estava vendo em cada etapa para ajudar a entender por que decisões ruins foram tomadas.

Categorias de Falha

spin
tool_bug
early_abort

Modo de Aplicação

O recurso mais significativo, segundo o criador, é o modo de aplicação. Após corrigir um bug do agente, esse modo executa desafios adversariais contra suas correções para verificar se são legítimas. Ele verifica:

Retornos codificados
Afirmações enfraquecidas

Isso aborda o problema em que as correções podem funcionar em tarefas de teste específicas, mas na verdade são frágeis, ou onde os agentes aprendem a manipular o teste.

Integração de Fluxo de Trabalho

A ferramenta é executada como ferramentas MCP, permitindo que o Claude Code a use diretamente. Um fluxo de trabalho típico descrito na fonte:

Diga ao Claude Code para triar rastreamentos de agentes
Ele encontra a pior falha
Reproduz o que o agente viu
Sugere uma correção
O modo de aplicação verifica se a correção é legítima

O criador descreve isso como "agentes depurando agentes".

Detalhes Técnicos

Instalação: pip install agent-xray
Início rápido: agent-xray quickstart (inclui rastreamentos de amostra para testar sem seus próprios dados)
Licença: MIT
Zero dependências
Executa offline
Funciona com OpenAI, Anthropic, LangChain, CrewAI, rastreamentos OpenTelemetry
Tempo do projeto: Cerca de 9 dias no momento da postagem

Caso de Uso

Esta ferramenta é para desenvolvedores que trabalham com agentes de IA e precisam depurar falhas que não produzem erros tradicionais ou rastreamentos de pilha — situações em que os agentes tomam decisões incorretas apesar de terem acesso a ferramentas e informações corretas.

📖 Read the full source: r/ClaudeAI

Agente-Xray: Ferramenta de código aberto para depurar falhas de agentes de IA a partir de logs de rastreamento

Principais Recursos

Categorias de Falha

Modo de Aplicação

Integração de Fluxo de Trabalho

Detalhes Técnicos

Caso de Uso

👀 See Also

cc-lens: Painel Local para Análise de Sessões de Código Claude

Aplicativo Gratuito para macOS na Barra de Menu Monitora o Uso do Claude em Tempo Real

Claude Code UltraPlan: Alterações no Fluxo de Trabalho e Observações de Desempenho

Claude Code v2.1.59 adiciona memória automática, comando de cópia e melhorias no shell.