Verificador de alucinação estrutural de código aberto para pipelines de agentes de IA

✍️ OpenClawRadar📅 Publicado: March 11, 2026🔗 Source
Verificador de alucinação estrutural de código aberto para pipelines de agentes de IA
Ad

O que faz

Um verificador de alucinação estrutural projetado especificamente para pipelines de agentes de IA. Diferente da verificação de veracidade, esta ferramenta foca em capturar falhas estruturais que quebram ferramentas subsequentes.

Problema que resolve

A maioria dos problemas dos agentes não são erros factuais, mas problemas estruturais como:

  • O modelo inventar um campo em uma resposta de ferramenta JSON
  • Citar uma fonte que não estava no conjunto recuperado
  • Injeção de prompt escondida dentro do conteúdo recuperado
  • Afirmar que uma ferramenta retornou algo que não retornou

Quatro supressores

A ferramenta inclui quatro supressores construídos em Claude Code que rodam como um único passo antes que a saída do agente alcance os usuários:

  • grounding_enforcer - verifica se a saída do modelo é realmente suportada pelas fontes que você passou
  • prompt_suppressor - captura tentativas de injeção em conteúdo recuperado e resultados de ferramentas
  • json_suppressor - valida respostas estruturadas de ferramentas contra esquemas esperados
  • tool_response_suppressor - sinaliza quando a saída alegada de uma ferramenta não corresponde ao que ela retornou
Ad

Disponibilidade

A ferramenta está disponível em dois formatos:

  • Uma API REST
  • Um servidor MCP (funciona com Claude Desktop, Cursor, Windsurf, etc.)

O nível gratuito oferece 500 requisições/mês sem necessidade de cartão de crédito.

Source and documentation

Repositório GitHub: https://github.com/steveswain14/mcp-hallucination-suite

API e documentação: https://certifai.dev

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Habilidades do Claude de Código Aberto para Gerentes de Produto: Gerador de PRD, Histórias de Usuário, Anotações de Reuniões
Tools

Habilidades do Claude de Código Aberto para Gerentes de Produto: Gerador de PRD, Histórias de Usuário, Anotações de Reuniões

Um desenvolvedor lançou cinco habilidades gratuitas do Claude AI para gerentes de produto que geram arquivos .docx formatados para PRDs, histórias de usuário, síntese de reuniões, pesquisa de mercado e atualizações para stakeholders. As ferramentas evitam conteúdo alucinado e usam modelos estruturados.

OpenClawRadar
Vibeyard adiciona compartilhamento de sessão P2P para Claude Code
Tools

Vibeyard adiciona compartilhamento de sessão P2P para Claude Code

Vibeyard, um IDE de código aberto para Claude Code, agora suporta compartilhamento de sessões peer-to-peer. Os usuários podem compartilhar sessões de terminal ao vivo com colegas de equipe por meio de conexões WebRTC criptografadas, com modos de acesso somente leitura ou leitura e escrita.

OpenClawRadar
Google Lança Sashiko: Agente de Revisão de Código com IA para Patches do Kernel Linux
Tools

Google Lança Sashiko: Agente de Revisão de Código com IA para Patches do Kernel Linux

Engenheiros do Google disponibilizaram como código aberto o Sashiko, um sistema de revisão de código com IA agentiva projetado para o kernel Linux. Ele encontrou 53% dos bugs em um conjunto não filtrado de 1.000 problemas recentes do upstream que foram perdidos por revisores humanos.

OpenClawRadar
Memtrace: Memória Persistente e Consciente do Tempo para Agentes de Código Claude
Tools

Memtrace: Memória Persistente e Consciente do Tempo para Agentes de Código Claude

Memtrace fornece snapshots sempre atualizados e reprodução bi-temporal para agentes Claude Code, utilizando análise de AST com Tree-sitter e recuperação híbrida (BM25 + embeddings Jina-code) com custo zero de inferência LLM durante a indexação.

OpenClawRadar