Débogage d'agents IA : Culpa, outil open source déterministe

Culpa est un moteur de relecture déterministe open source conçu spécifiquement pour le débogage des sessions d'agents d'IA. Le problème central qu'il résout est la nature non déterministe des agents LLM—lorsqu'ils échouent, vous ne pouvez pas reproduire l'échec exact en relançant simplement la session.

Comment cela fonctionne

L'outil enregistre chaque appel LLM ainsi que le contexte d'exécution complet pendant une session d'agent. Lorsque vous devez déboguer un échec, il relit la session en utilisant les réponses enregistrées comme substituts au lieu d'effectuer de nouveaux appels API. Cela rend la relecture entièrement déterministe et ne coûte rien puisqu'elle n'accède pas aux véritables API.

Fonctionnalités clés

Mode Proxy: Fonctionne avec des outils comme Claude Code et Cursor sans nécessiter de modifications de code
SDK Python: Disponible pour les développeurs créant leurs propres agents
Support API: Compatible avec les API Anthropic et OpenAI
Capacité de bifurcation: Vous pouvez bifurquer à n'importe quel point de décision enregistré, injecter une réponse différente et voir ce qui se serait passé

Avantages pratiques

Puisque la relecture utilise des réponses enregistrées au lieu d'effectuer de véritables appels API, les sessions de débogage n'engendrent aucun coût API. La nature déterministe des relectures permet de reproduire et d'analyser de manière fiable des échecs qui seraient autrement impossibles à recréer en raison du caractère aléatoire inhérent des réponses LLM.

Le projet recherche activement des retours, en particulier de la part des développeurs créant des flux de travail d'agents. Le créateur note qu'il est étudiant en première année d'informatique et cherche à améliorer l'outil.

📖 Read the full source: r/LocalLLaMA

Culpa : Moteur de relecture déterministe open source pour le débogage d'agents IA

Comment cela fonctionne

Fonctionnalités clés

Avantages pratiques

👀 See Also

Open Source Claude Code Skills pour un Contenu de Réseaux Sociaux Personnalisé

WAYD : Une pause sociale de 60 secondes dans Claude Code, Cursor, et Copilot CLI

HostedShell : Une Solution de Déploiement Web pour les Agents OpenClaw

Plugin de mémoire de l'agent OpenClaw : Contexte persistant entre les sessions