Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA

✍️ OpenClawRadar📅 Publicado: 20 de abril de 2026🔗 Source
Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA
Ad

Culpa es un motor de reproducción determinista de código abierto diseñado específicamente para depurar sesiones de agentes de IA. El problema central que aborda es la naturaleza no determinista de los agentes LLM: cuando fallan, no puedes reproducir el fallo exacto simplemente reejecutando la sesión.

Cómo funciona

La herramienta registra cada llamada LLM junto con el contexto de ejecución completo durante una sesión de agente. Cuando necesitas depurar un fallo, reproduce la sesión utilizando las respuestas grabadas como stubs en lugar de realizar nuevas llamadas API. Esto hace que la reproducción sea completamente determinista y no cuesta nada ya que no accede a las APIs reales.

Características principales

  • Modo proxy: Funciona con herramientas como Claude Code y Cursor sin requerir cambios de código
  • SDK de Python: Disponible para desarrolladores que construyen sus propios agentes
  • Soporte de API: Compatible con las APIs de Anthropic y OpenAI
  • Capacidad de bifurcación: Puedes bifurcar en cualquier punto de decisión grabado, inyectar una respuesta diferente y ver qué habría sucedido
Ad

Beneficios prácticos

Dado que la reproducción utiliza respuestas grabadas en lugar de realizar llamadas API reales, las sesiones de depuración no incurren en costos de API. La naturaleza determinista de las reproducciones hace posible reproducir y analizar fallos de manera confiable que de otro modo serían imposibles de recrear debido a la aleatoriedad inherente en las respuestas de los LLM.

El proyecto está buscando activamente comentarios, particularmente de desarrolladores que construyen flujos de trabajo de agentes. El creador señala que es un estudiante de primer año de informática y busca mejorar la herramienta.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Servidor MCP: Comparando LLMs Locales y en la Nube con Función de Debate
Herramientas

Servidor MCP: Comparando LLMs Locales y en la Nube con Función de Debate

El servidor MCP permite a los desarrolladores consultar modelos locales a través de Ollama junto con varios LLM en la nube, ofreciendo características como comparación lado a lado y una función de debate estructurado.

OpenClawRadar
Agenexus: Plataforma Nativa de Agentes para la Colaboración Autónoma de IA
Herramientas

Agenexus: Plataforma Nativa de Agentes para la Colaboración Autónoma de IA

Agenexus es una plataforma donde los agentes de IA se registran mediante un archivo SKILL.md, completan desafíos de capacidad verificados por la API de Claude, y se emparejan semánticamente para colaborar sin intervención humana. Construido con Next.js, Supabase, incrustaciones de Voyage AI y API de Claude.

OpenClawRadar
Corrección de Fuga de Memoria de Claude Code para Homelabs Linux
Herramientas

Corrección de Fuga de Memoria de Claude Code para Homelabs Linux

Un desarrollador descubrió que Claude Code tiene una grave fuga de memoria en glibc malloc que consumió 400GB de RAM y colapsó su homelab Proxmox, luego creó una solución de protección de dos niveles con un shim LD_PRELOAD y un watchdog.

OpenClawRadar
Claude Code como Compilador: Un Replanteamiento Práctico para el Desarrollo de IA
Herramientas

Claude Code como Compilador: Un Replanteamiento Práctico para el Desarrollo de IA

Una publicación de Reddit argumenta que Claude Code funciona como un compilador que traduce inglés a software funcional, estableciendo paralelismos con hitos históricos de la informática como el A-0 de Grace Hopper y FORTRAN. El autor describe generar 400 líneas en 6 archivos a partir de una descripción en inglés de 3 párrafos, detectando dos problemas en 25 minutos.

OpenClawRadar