Culpa: Open Source Deterministic Replay Engine for AI Agent Debugging

Culpa ist eine Open-Source-Deterministic-Replay-Engine, die speziell für das Debugging von KI-Agent-Sitzungen entwickelt wurde. Das Kernproblem, das es angeht, ist die nicht-deterministische Natur von LLM-Agenten – wenn sie scheitern, kann man den genauen Fehler nicht einfach durch erneutes Ausführen der Sitzung reproduzieren.
Wie es funktioniert
Das Tool zeichnet jeden LLM-Aufruf zusammen mit dem vollständigen Ausführungskontext während einer Agent-Sitzung auf. Wenn Sie einen Fehler debuggen müssen, gibt es die Sitzung unter Verwendung der aufgezeichneten Antworten als Stubs wieder, anstatt neue API-Aufrufe zu tätigen. Dies macht die Wiedergabe vollständig deterministisch und kostet nichts, da keine echten APIs angesteuert werden.
Wichtige Funktionen
- Proxy-Modus: Funktioniert mit Tools wie Claude Code und Cursor, ohne Codeänderungen zu erfordern
- Python SDK: Verfügbar für Entwickler, die ihre eigenen Agenten erstellen
- API-Unterstützung: Kompatibel mit Anthropic- und OpenAI-APIs
- Forking-Fähigkeit: Sie können an jedem aufgezeichneten Entscheidungspunkt forken, eine andere Antwort injizieren und sehen, was passiert wäre
Praktische Vorteile
Da die Wiedergabe aufgezeichnete Antworten verwendet, anstatt tatsächliche API-Aufrufe zu tätigen, verursachen Debugging-Sitzungen keine API-Kosten. Die deterministische Natur der Wiedergaben ermöglicht es, Fehler zuverlässig zu reproduzieren und zu analysieren, die aufgrund der inhärenten Zufälligkeit von LLM-Antworten sonst nicht nachvollziehbar wären.
Das Projekt sucht aktiv nach Feedback, insbesondere von Entwicklern, die Agent-Workflows erstellen. Der Ersteller merkt an, dass er ein CS-Erstsemester ist und das Tool verbessern möchte.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Claude Codes offizielles Telegram-Plugin: Einrichtungshinweise und Migration von OpenClaw
Ein Entwickler migrierte von OpenClaw zur offiziellen Telegram-Integration von Claude Code, dokumentierte den Einrichtungsprozess und erstellte eine Open-Source-Migrationsfunktion. Die Integration verbindet sich über BotFather-Tokens und bietet eine bessere Token-Effizienz sowie klarere Kommunikation.

Automatisierung von Claude Desktop-Release-Notes aus minifizierten Electron-Apps
Ein Entwickler hat eine automatisierte Pipeline mit Claude Sonnet und Opus 4.6 erstellt, um Release Notes für Claude Desktop unter Linux zu generieren, um das Fehlen offizieller Release Notes von Anthropic zu beheben. Das System extrahiert, normalisiert und analysiert minifizierten Electron-App-Code als Teil eines CI/CD-Workflows.

Open-Source-Persistenzspeichersystem für Claude Code löst Kontextverlust zwischen Sitzungen
Ein Entwickler hat ein dateibasiertes Speichersystem für Claude Code erstellt, das automatisch Projektkontext erfasst, ohne Plugins oder API-Schlüssel zu benötigen. Es nutzt Konversationsprotokolle, eine Eingangsdatei und nächtliche Cron-Jobs, um dauerhaften Speicher über Sitzungen hinweg zu erhalten.

Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines
Ein neues Open-Source-Tool bietet vier Unterdrücker, um strukturelle Fehler in KI-Agenten-Pipelines zu erkennen, darunter Grounding-Erzwingung, Prompt-Injection-Erkennung, JSON-Validierung und Tool-Antwort-Verifizierung. Verfügbar als REST-API und MCP-Server mit einem kostenlosen Kontingent von 500 Anfragen/Monat.