Agente-Xray: Ferramenta de código aberto para depurar falhas de agentes de IA a partir de logs de rastreamento

Agent-Xray é uma ferramenta de código aberto para depurar agentes de IA analisando seus logs de rastreamento. Foi criada para resolver o problema de agentes que falham em tarefas sem erros claros — situações em que o código é executado normalmente, mas o agente toma decisões erradas, como chamar repetidamente a ferramenta errada apesar de mensagens de erro sugerirem a correta.
Principais Recursos
A ferramenta lê logs de rastreamento e fornece classificação estrutural e de causa raiz para falhas de agentes. Ela reconstrói o que o agente estava vendo em cada etapa para ajudar a entender por que decisões ruins foram tomadas.
Categorias de Falha
- spin
- tool_bug
- early_abort
Modo de Aplicação
O recurso mais significativo, segundo o criador, é o modo de aplicação. Após corrigir um bug do agente, esse modo executa desafios adversariais contra suas correções para verificar se são legítimas. Ele verifica:
- Retornos codificados
- Afirmações enfraquecidas
Isso aborda o problema em que as correções podem funcionar em tarefas de teste específicas, mas na verdade são frágeis, ou onde os agentes aprendem a manipular o teste.
Integração de Fluxo de Trabalho
A ferramenta é executada como ferramentas MCP, permitindo que o Claude Code a use diretamente. Um fluxo de trabalho típico descrito na fonte:
- Diga ao Claude Code para triar rastreamentos de agentes
- Ele encontra a pior falha
- Reproduz o que o agente viu
- Sugere uma correção
- O modo de aplicação verifica se a correção é legítima
O criador descreve isso como "agentes depurando agentes".
Detalhes Técnicos
- Instalação:
pip install agent-xray - Início rápido:
agent-xray quickstart(inclui rastreamentos de amostra para testar sem seus próprios dados) - Licença: MIT
- Zero dependências
- Executa offline
- Funciona com OpenAI, Anthropic, LangChain, CrewAI, rastreamentos OpenTelemetry
- Tempo do projeto: Cerca de 9 dias no momento da postagem
Caso de Uso
Esta ferramenta é para desenvolvedores que trabalham com agentes de IA e precisam depurar falhas que não produzem erros tradicionais ou rastreamentos de pilha — situações em que os agentes tomam decisões incorretas apesar de terem acesso a ferramentas e informações corretas.
📖 Read the full source: r/ClaudeAI
👀 See Also

Chat Saver CG: Extensão de Navegador Criada com Claude Exporta Conversas de 12 Plataformas de IA
Um desenvolvedor criou o Chat Saver CG, uma extensão de navegador que exporta e transfere conversas entre Claude, ChatGPT, Gemini e outras 9 plataformas de IA, usando extensivamente o Claude para o desenvolvimento, incluindo decisões de arquitetura, depuração de problemas de análise DOM e escrita da lógica do adaptador.

Claude Code usuário cria comando /discuss para conversas somente leitura
Um usuário do Claude Code criou uma habilidade personalizada de 25 linhas chamada /discuss que permite conversas somente leitura sem modificações de arquivos. O comando permite exploração de código, pesquisa e discussão enquanto impede edições, usando a flag --dangerously-skip-permissions com segurança integrada.

O Atelier v0.3 adiciona revisões direcionadas de markdown com o Claude Code
Atelier v0.3 é uma extensão gratuita do VS Code que permite destacar seções de documentos markdown e enviá-las para o Claude Code para revisões. O agente responde com edições direcionadas no editor, e você pode acompanhar qual feedback cada revisão aborda.

Klaw.sh: Orquestração no Estilo Kubernetes para Agentes de IA
Klaw.sh oferece uma solução de orquestração para implantação de agentes de IA, modelada no Kubernetes. Ele simplifica o gerenciamento com clusters, namespaces e canais, alcançando redução de memória ao reescrever de Node.js para Go.