Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA

Culpa es un motor de reproducción determinista de código abierto diseñado específicamente para depurar sesiones de agentes de IA. El problema central que aborda es la naturaleza no determinista de los agentes LLM: cuando fallan, no puedes reproducir el fallo exacto simplemente reejecutando la sesión.
Cómo funciona
La herramienta registra cada llamada LLM junto con el contexto de ejecución completo durante una sesión de agente. Cuando necesitas depurar un fallo, reproduce la sesión utilizando las respuestas grabadas como stubs en lugar de realizar nuevas llamadas API. Esto hace que la reproducción sea completamente determinista y no cuesta nada ya que no accede a las APIs reales.
Características principales
- Modo proxy: Funciona con herramientas como Claude Code y Cursor sin requerir cambios de código
- SDK de Python: Disponible para desarrolladores que construyen sus propios agentes
- Soporte de API: Compatible con las APIs de Anthropic y OpenAI
- Capacidad de bifurcación: Puedes bifurcar en cualquier punto de decisión grabado, inyectar una respuesta diferente y ver qué habría sucedido
Beneficios prácticos
Dado que la reproducción utiliza respuestas grabadas en lugar de realizar llamadas API reales, las sesiones de depuración no incurren en costos de API. La naturaleza determinista de las reproducciones hace posible reproducir y analizar fallos de manera confiable que de otro modo serían imposibles de recrear debido a la aleatoriedad inherente en las respuestas de los LLM.
El proyecto está buscando activamente comentarios, particularmente de desarrolladores que construyen flujos de trabajo de agentes. El creador señala que es un estudiante de primer año de informática y busca mejorar la herramienta.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Servidor MCP: Comparando LLMs Locales y en la Nube con Función de Debate
El servidor MCP permite a los desarrolladores consultar modelos locales a través de Ollama junto con varios LLM en la nube, ofreciendo características como comparación lado a lado y una función de debate estructurado.

Agenexus: Plataforma Nativa de Agentes para la Colaboración Autónoma de IA
Agenexus es una plataforma donde los agentes de IA se registran mediante un archivo SKILL.md, completan desafíos de capacidad verificados por la API de Claude, y se emparejan semánticamente para colaborar sin intervención humana. Construido con Next.js, Supabase, incrustaciones de Voyage AI y API de Claude.

Corrección de Fuga de Memoria de Claude Code para Homelabs Linux
Un desarrollador descubrió que Claude Code tiene una grave fuga de memoria en glibc malloc que consumió 400GB de RAM y colapsó su homelab Proxmox, luego creó una solución de protección de dos niveles con un shim LD_PRELOAD y un watchdog.

Claude Code como Compilador: Un Replanteamiento Práctico para el Desarrollo de IA
Una publicación de Reddit argumenta que Claude Code funciona como un compilador que traduce inglés a software funcional, estableciendo paralelismos con hitos históricos de la informática como el A-0 de Grace Hopper y FORTRAN. El autor describe generar 400 líneas en 6 archivos a partir de una descripción en inglés de 3 párrafos, detectando dos problemas en 25 minutos.