Verificador de alucinaciones estructurales de código abierto para pipelines de agentes de IA

Qué hace
Un verificador de alucinaciones estructurales diseñado específicamente para canalizaciones de agentes de IA. A diferencia de la verificación de veracidad, esta herramienta se centra en detectar fallos estructurales que rompen las herramientas posteriores.
Problema que resuelve
La mayoría de los problemas de los agentes no son errores fácticos, sino problemas estructurales como:
- El modelo inventa un campo en una respuesta de herramienta JSON
- Cita una fuente que no estaba en el conjunto recuperado
- Inyección de prompts oculta dentro del contenido recuperado
- Afirma que una herramienta devolvió algo que no devolvió
Cuatro supresores
La herramienta incluye cuatro supresores integrados en Claude Code que se ejecutan como un solo paso antes de que la salida del agente llegue a los usuarios:
grounding_enforcer- verifica si la salida del modelo está realmente respaldada por las fuentes que pasasteprompt_suppressor- detecta intentos de inyección en el contenido recuperado y en los resultados de las herramientasjson_suppressor- valida las respuestas estructuradas de las herramientas contra los esquemas esperadostool_response_suppressor- marca cuando la salida declarada de una herramienta no coincide con lo que realmente devolvió
Disponibilidad
La herramienta está disponible en dos formatos:
- Una API REST
- Un servidor MCP (funciona con Claude Desktop, Cursor, Windsurf, etc.)
El nivel gratuito ofrece 500 solicitudes/mes sin necesidad de tarjeta de crédito.
Source y documentación
Repositorio de GitHub: https://github.com/steveswain14/mcp-hallucination-suite
API y documentación: https://certifai.dev
📖 Read the full source: r/ClaudeAI
👀 Ver también

LLM-Memory.net: Sistema de Memoria de Código Abierto con Infraestructura Multi-Agente
LLM-Memory.net es un sistema de memoria autoalojable para agentes de IA que proporciona almacenamiento de notas con búsqueda semántica, comunicación en tiempo real por chat/correo entre agentes, discusiones estructuradas con votación e integración de servidor MCP. El código fuente completo está disponible en GitHub con un instalador y playbooks de Ansible.

Índices Persistentes sobre Extracción: Arquitectura para un Servidor MCP de YouTube
Un desarrollador comparte notas de arquitectura para construir un servidor MCP de YouTube que utiliza índices locales persistentes en lugar del patrón común de extraer y olvidar. Las decisiones clave incluyen un sistema de respaldo de tres niveles, SQLite + sqlite-vec para almacenamiento vectorial, abstracción del proveedor de incrustaciones y un índice de búsqueda visual separado.

AutoDream: sistema de memoria de 11 ganchos para Claude Code con funciones de seguridad
AutoDream es una herramienta de código abierto que añade persistencia de memoria de proyecto y seguridad de comandos a Claude Code. Utiliza 11 hooks en 6 eventos para inyectar contexto, bloquear comandos peligrosos y sobrevivir a la operación /compact.

Hearth: Aplicación de Chat con IA Multiusuario Autohospedada para Hogares en OpenClaw
Hearth es una aplicación de chat de IA doméstica autoalojada construida sobre OpenClaw que proporciona cuentas y conversaciones separadas para cada miembro de la familia, con funciones que incluyen inicio de sesión con PIN/biometría, chats privados, recordatorios y preajustes de modelos.