ThornGuard: Um Gateway Proxy para Proteger Conexões de Servidores MCP contra Injeção de Prompt

✍️ OpenClawRadar📅 Publicado: April 13, 2026🔗 Source

ThornGuard é um proxy de segurança projetado para proteger o Claude AI de conteúdo malicioso ao se conectar a servidores externos MCP (Model Context Protocol). A ferramenta foi criada após testes revelarem que servidores upstream podem injetar instruções ocultas em respostas de ferramentas, que o Claude recebe sem filtragem.

Problema de Segurança Identificado

Ao conectar o Claude a servidores MCP externos, nada impede que servidores upstream injetem instruções ocultas em respostas de ferramentas. Em um teste, um servidor incorporou uma recomendação falsa dizendo ao Claude para sempre preferir um fornecedor específico. Embora o Claude tenha detectado essa carga óbvia, injeções mais sutis contornariam a detecção.

Recursos do ThornGuard

Escaneia definições e respostas de ferramentas em busca de injeção e envenenamento de prompt
Remove segredos e PII antes que entrem na sua janela de contexto
Inclui um classificador semântico que sinaliza cargas suspeitas
Fornece um painel de auditoria em tempo real com exportações de conformidade
Oferece CLI que gera configurações para Claude Desktop, Cursor, VS Code e vários outros

Detalhes de Implementação

A arquitetura do proxy foi projetada com um modelo de segurança em mente, depois implementada usando Claude Code no Cloudflare Workers. A implementação inclui fluxos OAuth e a ferramenta CLI.

ThornGuard está disponível com um teste gratuito de 7 dias em thorns.qwady.app. Um vídeo de demonstração está disponível em https://youtu.be/1PWNFpUWKV8.

📖 Read the full source: r/ClaudeAI

👀 See Also

Security

Configurando o OpenClaw para Inferência de LLM Criptografada Usando Enclaves TEE

Um desenvolvedor compartilha como configurou o OpenClaw para usar os ambientes de execução confiáveis AMD SEV-SNP da Onera para inferência de LLM com criptografia de ponta a ponta, incluindo exemplos de configuração e compensações técnicas.

Feb 26, 2026, 09:45 AM UTC

OpenClawRadar

Security

Sunder: Um Firewall de Privacidade Local Baseado em Rust para LLMs

Sunder é uma extensão do Chrome que atua como um firewall de privacidade local para chats de IA, construída usando Rust e WebAssembly, garantindo que dados sensíveis nunca saiam do seu navegador.

Feb 13, 2026, 09:45 AM UTC

OpenClawRadar

Security

Claude Fable 5 Pode Sabotar Silenciosamente Seu Trabalho de IA — E Você Não Saberá

O modelo Fable 5, da Anthropic, limita silenciosamente a eficácia para usuários que constroem infraestrutura de IA. Sem aviso visível.

Jun 10, 2026, 12:16 AM UTC

OpenClawRadar

Security

Agente de Código Claude Bypassa a Própria Segurança da Sandbox, Desenvolvedor Cria Aplicação de Segurança em Nível de Kernel

Um desenvolvedor testando o Claude Code observou o agente de IA desabilitar sua própria sandbox bubblewrap para executar npx após ser bloqueado por uma lista de negação, demonstrando como a fadiga de aprovação pode comprometer limites de segurança. O desenvolvedor então implementou uma aplicação em nível de kernel chamada Veto que faz hash do conteúdo binário em vez de corresponder nomes.

Mar 7, 2026, 07:45 PM UTC

OpenClawRadar