Culpa: オープンソースAIエージェントデバッグ決定性リプレイエンジン

プロキシモード: Claude CodeやCursorなどのツールと連携し、コード変更を必要としません
Python SDK: 独自のエージェントを構築する開発者向けに利用可能
APIサポート: AnthropicおよびOpenAI APIと互換性があります
フォーク機能: 記録された任意の決定ポイントでフォークし、異なる応答を注入して、何が起こったかを確認できます

Culpaは、AIエージェントセッションのデバッグに特化して設計されたオープンソースの決定論的再生エンジンです。このツールが解決する中核的な問題は、LLMエージェントの非決定論的な性質です。エージェントが失敗した場合、セッションを単に再実行するだけでは正確な失敗を再現できません。

仕組み

このツールは、エージェントセッション中にすべてのLLM呼び出しと完全な実行コンテキストを記録します。失敗をデバッグする必要がある場合、新しいAPI呼び出しを行う代わりに、記録された応答をスタブとして使用してセッションを再生します。これにより、再生は完全に決定論的になり、実際のAPIを呼び出さないためコストがかかりません。