Agent-Xray: Open-Source-Tool zum Debuggen von KI-Agent-Fehlern aus Trace-Logs

Agent-Xray ist ein Open-Source-Tool zum Debuggen von KI-Agenten durch die Analyse ihrer Trace-Protokolle. Es wurde entwickelt, um das Problem zu lösen, dass Agenten Aufgaben ohne klare Fehlermeldungen nicht erfüllen – Situationen, in denen der Code einwandfrei läuft, der Agent aber falsche Entscheidungen trifft, wie etwa das wiederholte Aufrufen des falschen Tools, obwohl Fehlermeldungen das richtige nahelegen.
Hauptfunktionen
Das Tool liest Trace-Protokolle und bietet strukturelle Bewertung und Ursachenklassifizierung für Agentenfehler. Es rekonstruiert, was der Agent in jedem Schritt gesehen hat, um zu verstehen, warum schlechte Entscheidungen getroffen wurden.
Fehlerkategorien
- Spin
- Tool-Bug
- Early-Abort
Enforcement-Modus
Die bedeutendste Funktion laut dem Ersteller ist der Enforcement-Modus. Nach der Behebung eines Agenten-Fehlers führt dieser Modus adversarische Herausforderungen gegen Ihre Korrekturen aus, um zu überprüfen, ob sie legitim sind. Er prüft auf:
- Hartkodierte Rückgaben
- Abgeschwächte Assertions
Dies behebt das Problem, dass Korrekturen bei bestimmten Testaufgaben funktionieren könnten, aber tatsächlich fragil sind, oder dass Agenten lernen, den Test zu umgehen.
Workflow-Integration
Das Tool läuft als MCP-Tools, sodass Claude Code es direkt nutzen kann. Ein typischer Workflow laut der Quelle:
- Claude Code anweisen, Agenten-Traces zu triagieren
- Es findet den schwerwiegendsten Fehler
- Spielt wieder, was der Agent gesehen hat
- Schlägt eine Korrektur vor
- Der Enforcement-Modus überprüft, ob die Korrektur legitim ist
Der Ersteller beschreibt dies als "Agenten, die Agenten debuggen".
Technische Details
- Installation:
pip install agent-xray - Schnellstart:
agent-xray quickstart(enthält Beispiel-Traces zum Testen ohne eigene Daten) - Lizenz: MIT
- Keine Abhängigkeiten
- Läuft offline
- Funktioniert mit OpenAI-, Anthropic-, LangChain-, CrewAI-, OpenTelemetry-Traces
- Projektalter: Etwa 9 Tage zum Zeitpunkt der Veröffentlichung
Anwendungsfall
Dieses Tool ist für Entwickler gedacht, die mit KI-Agenten arbeiten und Fehler debuggen müssen, die keine traditionellen Fehler oder Stack-Traces erzeugen – Situationen, in denen Agenten trotz Zugriff auf korrekte Tools und Informationen falsche Entscheidungen treffen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Storybloq: Ein Projekt-Tracker für Claude Code mit Mac-App, CLI und MCP
Storybloq ist ein kostenloser Open-Source-Projekt-Tracker, der in .story/ innerhalb deines Repos lebt. Er umfasst eine Mac-App (App Store), eine CLI und einen MCP-Server, um Tickets, Issues und Session-Handovers an Claude Code bereitzustellen.

Claude Code v2.1.90 fügt Mausunterstützung mit dem Flag CLAUDE_CODE_NO_FLICKER hinzu
Anthropic hat Claude Code v2.1.90 mit einer neuen Funktion veröffentlicht, die Mausunterstützung in der Chat-Oberfläche ermöglicht. Benutzer können sie aktivieren, indem sie die Umgebungsvariable CLAUDE_CODE_NO_FLICKER=1 setzen, bevor sie claude ausführen.

Wissens-Rabe: Eine modellunabhängige Wissensbasis-Plattform, erstellt mit Claude Code
Knowledge Raven ist eine Wissensbasis-Plattform, die es jedem MCP-kompatiblen LLM ermöglicht, Unternehmensdokumente zu durchsuchen und zu zitieren. Die gesamte Plattform wurde von einem Einzelgründer mit Claude Code entwickelt und verfügt über ein Python/FastAPI-Backend, eine MCP-Tool-Schicht und eine agentenbasierte RAG-Pipeline.
Usage4Claude 3.0.0: Open Source macOS Menüleisten-Tracker für Claude und Codex
Usage4Claude 3.0.0 fügt optionale Codex-Unterstützung, integrierten Browser-Login für Claude, Multi-Konto-Wechsel und lokalisierte Benachrichtigungen hinzu.