Agente-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA

Agent-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA
O especialista em cibersegurança sysinternalssuite criou o Agent-Drift — uma ferramenta de código aberto para proteger agentes de IA contra injeção de prompt, desvio comportamental e outros ataques. Basicamente, um SIEM + IDS especificamente para OpenClaw.
Por Que Isso Existe
"Trabalho em Cibersegurança e tenho notado um aumento em injeção de prompt, desvio comportamental, envenenamento de memória e mais na natureza com agentes de IA"
O Que o Agent-Drift Faz
GitHub: https://github.com/lukehebe/Agent-Drift
A ferramenta funciona como um wrapper para OpenClaw:
- Coleta linha de base de comportamento
- Detecta desvio comportamental
- Alerta através do painel
Monitoramento de Comportamento
Padrões rastreados:
- Sequências e frequências de uso de ferramentas
- Anomalias de tempo
- Padrões de decisão
- Características de saída
Detecção de Ataques
| Ataque | Descrição |
|---|---|
| Sobrescrita de instrução | Sequestro de comando |
| Sequestro de função | Tomada de função |
| Tentativas de jailbreak | Bypass de restrições |
| Exfiltração de dados | Vazamento de dados |
| Cargas codificadas | Cargas ofuscadas |
| Envenenamento de memória | Corrupção de memória |
| Escalada de privilégios | Elevação de direitos |
| Injeção de prompt indireta | Ataques indiretos |
Como Funciona
- Aprendizado de Linha de Base — primeiras execuções estabelecem comportamento normal
- Vetores Comportamentais — cada execução se torna um vetor multidimensional
- Detecção de Desvio — novas execuções comparadas com a linha de base
- Alertas de Anomalia — desvios significativos disparam avisos
TL;DR
"Basicamente um Security Incident Event Manager (SIEM) completo para seu agente de IA que age como um Intrusion Detection System (IDS) que também alerta se sua IA começar a ficar maluca."
Fonte: u/sysinternalssuite no r/moltbot
📖 Leia a fonte completa: Reddit
👀 See Also

Coldkey: Geração de Chaves na Era Pós-Quântica e Ferramenta de Backup em Papel
Coldkey gera chaves age pós-quânticas (ML-KEM-768 + X25519) e produz backups HTML de página única para impressão com códigos QR para armazenamento offline.
Segurança de Agentes de IA: O Orçamento de Tokens Determina o Risco de Exfiltração de Dados
Um desenvolvedor testou agentes de IA conectados ao Gmail: modelos de ponta detectaram phishing, intermediários foram instáveis, modelos baratos encaminharam e-mails maliciosos silenciosamente. Proteções arquiteturais (sandbox, permissões) não impediram nenhuma tentativa.

Claw Hub e Hugging Face atingidos por 575 pacotes de habilidades maliciosos
Tanto o Claw Hub quanto o Hugging Face foram comprometidos, hospedando 575 pacotes de habilidades maliciosas. Os desenvolvedores são alertados a verificar qualquer habilidade que usem dessas plataformas.

Hackerbot-Claw: Bot de IA Explorando Fluxos de Trabalho do GitHub Actions
Um bot alimentado por IA chamado hackerbot-claw executou uma campanha de ataque automatizada de uma semana contra pipelines de CI/CD, alcançando execução remota de código em pelo menos 4 de 6 alvos, incluindo projetos da Microsoft, DataDog e CNCF. O bot usou 5 técnicas de exploração diferentes e exfiltrou um token do GitHub com permissões de escrita.