Detectar alucinaciones estructurales en agentes IA: herramienta open source

Qué hace

Un verificador de alucinaciones estructurales diseñado específicamente para canalizaciones de agentes de IA. A diferencia de la verificación de veracidad, esta herramienta se centra en detectar fallos estructurales que rompen las herramientas posteriores.

Problema que resuelve

La mayoría de los problemas de los agentes no son errores fácticos, sino problemas estructurales como:

El modelo inventa un campo en una respuesta de herramienta JSON
Cita una fuente que no estaba en el conjunto recuperado
Inyección de prompts oculta dentro del contenido recuperado
Afirma que una herramienta devolvió algo que no devolvió

Cuatro supresores

La herramienta incluye cuatro supresores integrados en Claude Code que se ejecutan como un solo paso antes de que la salida del agente llegue a los usuarios:

grounding_enforcer - verifica si la salida del modelo está realmente respaldada por las fuentes que pasaste
prompt_suppressor - detecta intentos de inyección en el contenido recuperado y en los resultados de las herramientas
json_suppressor - valida las respuestas estructuradas de las herramientas contra los esquemas esperados
tool_response_suppressor - marca cuando la salida declarada de una herramienta no coincide con lo que realmente devolvió

Disponibilidad

La herramienta está disponible en dos formatos:

Una API REST
Un servidor MCP (funciona con Claude Desktop, Cursor, Windsurf, etc.)

El nivel gratuito ofrece 500 solicitudes/mes sin necesidad de tarjeta de crédito.

Source y documentación

Repositorio de GitHub: https://github.com/steveswain14/mcp-hallucination-suite

API y documentación: https://certifai.dev

📖 Read the full source: r/ClaudeAI

Verificador de alucinaciones estructurales de código abierto para pipelines de agentes de IA

Qué hace

Problema que resuelve

Cuatro supresores

Disponibilidad

Source y documentación

👀 Ver también

LLM-Memory.net: Sistema de Memoria de Código Abierto con Infraestructura Multi-Agente

Índices Persistentes sobre Extracción: Arquitectura para un Servidor MCP de YouTube

AutoDream: sistema de memoria de 11 ganchos para Claude Code con funciones de seguridad

Hearth: Aplicación de Chat con IA Multiusuario Autohospedada para Hogares en OpenClaw