Culpa : Moteur de relecture déterministe open source pour le débogage d'agents IA

Culpa est un moteur de relecture déterministe open source conçu spécifiquement pour le débogage des sessions d'agents d'IA. Le problème central qu'il résout est la nature non déterministe des agents LLM—lorsqu'ils échouent, vous ne pouvez pas reproduire l'échec exact en relançant simplement la session.
Comment cela fonctionne
L'outil enregistre chaque appel LLM ainsi que le contexte d'exécution complet pendant une session d'agent. Lorsque vous devez déboguer un échec, il relit la session en utilisant les réponses enregistrées comme substituts au lieu d'effectuer de nouveaux appels API. Cela rend la relecture entièrement déterministe et ne coûte rien puisqu'elle n'accède pas aux véritables API.
Fonctionnalités clés
- Mode Proxy: Fonctionne avec des outils comme Claude Code et Cursor sans nécessiter de modifications de code
- SDK Python: Disponible pour les développeurs créant leurs propres agents
- Support API: Compatible avec les API Anthropic et OpenAI
- Capacité de bifurcation: Vous pouvez bifurquer à n'importe quel point de décision enregistré, injecter une réponse différente et voir ce qui se serait passé
Avantages pratiques
Puisque la relecture utilise des réponses enregistrées au lieu d'effectuer de véritables appels API, les sessions de débogage n'engendrent aucun coût API. La nature déterministe des relectures permet de reproduire et d'analyser de manière fiable des échecs qui seraient autrement impossibles à recréer en raison du caractère aléatoire inhérent des réponses LLM.
Le projet recherche activement des retours, en particulier de la part des développeurs créant des flux de travail d'agents. Le créateur note qu'il est étudiant en première année d'informatique et cherche à améliorer l'outil.
📖 Read the full source: r/LocalLLaMA
👀 See Also

WinRemote MCP : Serveur MCP Open Source pour le Contrôle Complet des Bureaux Windows
WinRemote MCP fournit aux agents IA un contrôle complet des bureaux Windows, permettant la détection d'interface utilisateur, les opérations sur les fichiers, l'accès au registre, et plus encore, grâce à plus de 40 outils.

CipherClaw : Utiliser un Personnage de Sécurité pour Auditer du Code avec Claude
Un développeur a utilisé CipherClaw, un persona CLAUDE.md appelé TALON, pour faire penser Claude Code comme un architecte de sécurité. Son exécution sur une application Next.js a révélé 17 problèmes de sécurité, dont des vulnérabilités critiques comme des points de terminaison non authentifiés renvoyant des données d'administrateur et des jetons d'authentification codés en dur.

Clawmates : OpenClaw, mais pour les Équipes
Un nouveau projet permet un déploiement multi-utilisateurs d'OpenClaw avec une base de connaissances partagée, une visibilité des coûts et des contrôles d'administration.

Le développeur d'OpenClaw construit un système de mémoire unifié pour les agents d'IA.
Un développeur a créé un système de mémoire unifié à 15 outils pour les agents d'IA OpenClaw qui combine des faits structurés, une recherche vectorielle, des graphes d'entités, des chronologies d'épisodes, une compression hiérarchique et une coordination pilotée par événements. Le système fonctionne localement sans dépendances cloud ni frais mensuels.