Agent-Xray: Open-Source-Tool zum Debuggen von KI-Agent-Fehlern aus Trace-Logs

✍️ OpenClawRadar📅 Veröffentlicht: 15. April 2026🔗 Source
Agent-Xray: Open-Source-Tool zum Debuggen von KI-Agent-Fehlern aus Trace-Logs
Ad

Agent-Xray ist ein Open-Source-Tool zum Debuggen von KI-Agenten durch die Analyse ihrer Trace-Protokolle. Es wurde entwickelt, um das Problem zu lösen, dass Agenten Aufgaben ohne klare Fehlermeldungen nicht erfüllen – Situationen, in denen der Code einwandfrei läuft, der Agent aber falsche Entscheidungen trifft, wie etwa das wiederholte Aufrufen des falschen Tools, obwohl Fehlermeldungen das richtige nahelegen.

Hauptfunktionen

Das Tool liest Trace-Protokolle und bietet strukturelle Bewertung und Ursachenklassifizierung für Agentenfehler. Es rekonstruiert, was der Agent in jedem Schritt gesehen hat, um zu verstehen, warum schlechte Entscheidungen getroffen wurden.

Fehlerkategorien

  • Spin
  • Tool-Bug
  • Early-Abort

Enforcement-Modus

Die bedeutendste Funktion laut dem Ersteller ist der Enforcement-Modus. Nach der Behebung eines Agenten-Fehlers führt dieser Modus adversarische Herausforderungen gegen Ihre Korrekturen aus, um zu überprüfen, ob sie legitim sind. Er prüft auf:

  • Hartkodierte Rückgaben
  • Abgeschwächte Assertions

Dies behebt das Problem, dass Korrekturen bei bestimmten Testaufgaben funktionieren könnten, aber tatsächlich fragil sind, oder dass Agenten lernen, den Test zu umgehen.

Ad

Workflow-Integration

Das Tool läuft als MCP-Tools, sodass Claude Code es direkt nutzen kann. Ein typischer Workflow laut der Quelle:

  1. Claude Code anweisen, Agenten-Traces zu triagieren
  2. Es findet den schwerwiegendsten Fehler
  3. Spielt wieder, was der Agent gesehen hat
  4. Schlägt eine Korrektur vor
  5. Der Enforcement-Modus überprüft, ob die Korrektur legitim ist

Der Ersteller beschreibt dies als "Agenten, die Agenten debuggen".

Technische Details

  • Installation: pip install agent-xray
  • Schnellstart: agent-xray quickstart (enthält Beispiel-Traces zum Testen ohne eigene Daten)
  • Lizenz: MIT
  • Keine Abhängigkeiten
  • Läuft offline
  • Funktioniert mit OpenAI-, Anthropic-, LangChain-, CrewAI-, OpenTelemetry-Traces
  • Projektalter: Etwa 9 Tage zum Zeitpunkt der Veröffentlichung

Anwendungsfall

Dieses Tool ist für Entwickler gedacht, die mit KI-Agenten arbeiten und Fehler debuggen müssen, die keine traditionellen Fehler oder Stack-Traces erzeugen – Situationen, in denen Agenten trotz Zugriff auf korrekte Tools und Informationen falsche Entscheidungen treffen.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Kanban CLI: Ein lokaler, agentenbasierter Task-Manager für das Terminal
Werkzeuge

Kanban CLI: Ein lokaler, agentenbasierter Task-Manager für das Terminal

Kanban CLI ist ein Rust-basiertes Terminal-Tool für strukturiertes Aufgabenmanagement mit vollständiger Git-Integration, das für KI-Agenten-Workflows entwickelt wurde.

OpenClawRadar
Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren
Werkzeuge

Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren

Browser Harness entfernt Browser-Frameworks und gewährt LLMs direkten CDP-Websocket-Zugriff, sodass sie fehlende Tools während der Aufgabe selbst schreiben können. Demonstriert durch die selbstständige Erstellung einer upload_file()-Funktion.

OpenClawRadar
Lokales Speichersystem für KI-Codierungstools extrahiert über 2.600 Fakten aus Konversationsprotokollen
Werkzeuge

Lokales Speichersystem für KI-Codierungstools extrahiert über 2.600 Fakten aus Konversationsprotokollen

Ein Entwickler hat eine lokale Speicherschicht erstellt, die Konversationsprotokolle von Claude Code, Factory.ai und Codex CLI verarbeitet, strukturierte Fakten mithilfe eines lokalen LLM extrahiert und Kontext automatisch in neue Sitzungen einfügt. Nach monatelangem Einsatz wurden über 13.000 Nachrichten indiziert und mehr als 2.600 Fakten extrahiert.

OpenClawRadar
Claude Code v2.1.90 fügt Mausunterstützung mit dem Flag CLAUDE_CODE_NO_FLICKER hinzu
Werkzeuge

Claude Code v2.1.90 fügt Mausunterstützung mit dem Flag CLAUDE_CODE_NO_FLICKER hinzu

Anthropic hat Claude Code v2.1.90 mit einer neuen Funktion veröffentlicht, die Mausunterstützung in der Chat-Oberfläche ermöglicht. Benutzer können sie aktivieren, indem sie die Umgebungsvariable CLAUDE_CODE_NO_FLICKER=1 setzen, bevor sie claude ausführen.

OpenClawRadar