Culpa: Open Source Deterministic Replay Engine for AI Agent Debugging

✍️ OpenClawRadar📅 Veröffentlicht: 20. April 2026🔗 Source
Culpa: Open Source Deterministic Replay Engine for AI Agent Debugging
Ad

Culpa ist eine Open-Source-Deterministic-Replay-Engine, die speziell für das Debugging von KI-Agent-Sitzungen entwickelt wurde. Das Kernproblem, das es angeht, ist die nicht-deterministische Natur von LLM-Agenten – wenn sie scheitern, kann man den genauen Fehler nicht einfach durch erneutes Ausführen der Sitzung reproduzieren.

Wie es funktioniert

Das Tool zeichnet jeden LLM-Aufruf zusammen mit dem vollständigen Ausführungskontext während einer Agent-Sitzung auf. Wenn Sie einen Fehler debuggen müssen, gibt es die Sitzung unter Verwendung der aufgezeichneten Antworten als Stubs wieder, anstatt neue API-Aufrufe zu tätigen. Dies macht die Wiedergabe vollständig deterministisch und kostet nichts, da keine echten APIs angesteuert werden.

Wichtige Funktionen

  • Proxy-Modus: Funktioniert mit Tools wie Claude Code und Cursor, ohne Codeänderungen zu erfordern
  • Python SDK: Verfügbar für Entwickler, die ihre eigenen Agenten erstellen
  • API-Unterstützung: Kompatibel mit Anthropic- und OpenAI-APIs
  • Forking-Fähigkeit: Sie können an jedem aufgezeichneten Entscheidungspunkt forken, eine andere Antwort injizieren und sehen, was passiert wäre
Ad

Praktische Vorteile

Da die Wiedergabe aufgezeichnete Antworten verwendet, anstatt tatsächliche API-Aufrufe zu tätigen, verursachen Debugging-Sitzungen keine API-Kosten. Die deterministische Natur der Wiedergaben ermöglicht es, Fehler zuverlässig zu reproduzieren und zu analysieren, die aufgrund der inhärenten Zufälligkeit von LLM-Antworten sonst nicht nachvollziehbar wären.

Das Projekt sucht aktiv nach Feedback, insbesondere von Entwicklern, die Agent-Workflows erstellen. Der Ersteller merkt an, dass er ein CS-Erstsemester ist und das Tool verbessern möchte.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Claude Codes offizielles Telegram-Plugin: Einrichtungshinweise und Migration von OpenClaw
Werkzeuge

Claude Codes offizielles Telegram-Plugin: Einrichtungshinweise und Migration von OpenClaw

Ein Entwickler migrierte von OpenClaw zur offiziellen Telegram-Integration von Claude Code, dokumentierte den Einrichtungsprozess und erstellte eine Open-Source-Migrationsfunktion. Die Integration verbindet sich über BotFather-Tokens und bietet eine bessere Token-Effizienz sowie klarere Kommunikation.

OpenClawRadar
Automatisierung von Claude Desktop-Release-Notes aus minifizierten Electron-Apps
Werkzeuge

Automatisierung von Claude Desktop-Release-Notes aus minifizierten Electron-Apps

Ein Entwickler hat eine automatisierte Pipeline mit Claude Sonnet und Opus 4.6 erstellt, um Release Notes für Claude Desktop unter Linux zu generieren, um das Fehlen offizieller Release Notes von Anthropic zu beheben. Das System extrahiert, normalisiert und analysiert minifizierten Electron-App-Code als Teil eines CI/CD-Workflows.

OpenClawRadar
Open-Source-Persistenzspeichersystem für Claude Code löst Kontextverlust zwischen Sitzungen
Werkzeuge

Open-Source-Persistenzspeichersystem für Claude Code löst Kontextverlust zwischen Sitzungen

Ein Entwickler hat ein dateibasiertes Speichersystem für Claude Code erstellt, das automatisch Projektkontext erfasst, ohne Plugins oder API-Schlüssel zu benötigen. Es nutzt Konversationsprotokolle, eine Eingangsdatei und nächtliche Cron-Jobs, um dauerhaften Speicher über Sitzungen hinweg zu erhalten.

OpenClawRadar
Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines
Werkzeuge

Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines

Ein neues Open-Source-Tool bietet vier Unterdrücker, um strukturelle Fehler in KI-Agenten-Pipelines zu erkennen, darunter Grounding-Erzwingung, Prompt-Injection-Erkennung, JSON-Validierung und Tool-Antwort-Verifizierung. Verfügbar als REST-API und MCP-Server mit einem kostenlosen Kontingent von 500 Anfragen/Monat.

OpenClawRadar