Verificador de alucinação estrutural de código aberto para pipelines de agentes de IA

O que faz
Um verificador de alucinação estrutural projetado especificamente para pipelines de agentes de IA. Diferente da verificação de veracidade, esta ferramenta foca em capturar falhas estruturais que quebram ferramentas subsequentes.
Problema que resolve
A maioria dos problemas dos agentes não são erros factuais, mas problemas estruturais como:
- O modelo inventar um campo em uma resposta de ferramenta JSON
- Citar uma fonte que não estava no conjunto recuperado
- Injeção de prompt escondida dentro do conteúdo recuperado
- Afirmar que uma ferramenta retornou algo que não retornou
Quatro supressores
A ferramenta inclui quatro supressores construídos em Claude Code que rodam como um único passo antes que a saída do agente alcance os usuários:
grounding_enforcer- verifica se a saída do modelo é realmente suportada pelas fontes que você passouprompt_suppressor- captura tentativas de injeção em conteúdo recuperado e resultados de ferramentasjson_suppressor- valida respostas estruturadas de ferramentas contra esquemas esperadostool_response_suppressor- sinaliza quando a saída alegada de uma ferramenta não corresponde ao que ela retornou
Disponibilidade
A ferramenta está disponível em dois formatos:
- Uma API REST
- Um servidor MCP (funciona com Claude Desktop, Cursor, Windsurf, etc.)
O nível gratuito oferece 500 requisições/mês sem necessidade de cartão de crédito.
Source and documentation
Repositório GitHub: https://github.com/steveswain14/mcp-hallucination-suite
API e documentação: https://certifai.dev
📖 Read the full source: r/ClaudeAI
👀 See Also

Habilidades do Claude de Código Aberto para Gerentes de Produto: Gerador de PRD, Histórias de Usuário, Anotações de Reuniões
Um desenvolvedor lançou cinco habilidades gratuitas do Claude AI para gerentes de produto que geram arquivos .docx formatados para PRDs, histórias de usuário, síntese de reuniões, pesquisa de mercado e atualizações para stakeholders. As ferramentas evitam conteúdo alucinado e usam modelos estruturados.

Vibeyard adiciona compartilhamento de sessão P2P para Claude Code
Vibeyard, um IDE de código aberto para Claude Code, agora suporta compartilhamento de sessões peer-to-peer. Os usuários podem compartilhar sessões de terminal ao vivo com colegas de equipe por meio de conexões WebRTC criptografadas, com modos de acesso somente leitura ou leitura e escrita.

Google Lança Sashiko: Agente de Revisão de Código com IA para Patches do Kernel Linux
Engenheiros do Google disponibilizaram como código aberto o Sashiko, um sistema de revisão de código com IA agentiva projetado para o kernel Linux. Ele encontrou 53% dos bugs em um conjunto não filtrado de 1.000 problemas recentes do upstream que foram perdidos por revisores humanos.

Memtrace: Memória Persistente e Consciente do Tempo para Agentes de Código Claude
Memtrace fornece snapshots sempre atualizados e reprodução bi-temporal para agentes Claude Code, utilizando análise de AST com Tree-sitter e recuperação híbrida (BM25 + embeddings Jina-code) com custo zero de inferência LLM durante a indexação.