Agente-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA

✍️ u/sysinternalssuite📅 Publicado: February 7, 2026🔗 Source
Agente-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA
Ad

Agent-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA

O especialista em cibersegurança sysinternalssuite criou o Agent-Drift — uma ferramenta de código aberto para proteger agentes de IA contra injeção de prompt, desvio comportamental e outros ataques. Basicamente, um SIEM + IDS especificamente para OpenClaw.

Por Que Isso Existe

"Trabalho em Cibersegurança e tenho notado um aumento em injeção de prompt, desvio comportamental, envenenamento de memória e mais na natureza com agentes de IA"

O Que o Agent-Drift Faz

GitHub: https://github.com/lukehebe/Agent-Drift

A ferramenta funciona como um wrapper para OpenClaw:

  1. Coleta linha de base de comportamento
  2. Detecta desvio comportamental
  3. Alerta através do painel

Monitoramento de Comportamento

Padrões rastreados:

  • Sequências e frequências de uso de ferramentas
  • Anomalias de tempo
  • Padrões de decisão
  • Características de saída
Ad

Detecção de Ataques

Ataque Descrição
Sobrescrita de instrução Sequestro de comando
Sequestro de função Tomada de função
Tentativas de jailbreak Bypass de restrições
Exfiltração de dados Vazamento de dados
Cargas codificadas Cargas ofuscadas
Envenenamento de memória Corrupção de memória
Escalada de privilégios Elevação de direitos
Injeção de prompt indireta Ataques indiretos

Como Funciona

  1. Aprendizado de Linha de Base — primeiras execuções estabelecem comportamento normal
  2. Vetores Comportamentais — cada execução se torna um vetor multidimensional
  3. Detecção de Desvio — novas execuções comparadas com a linha de base
  4. Alertas de Anomalia — desvios significativos disparam avisos

TL;DR

"Basicamente um Security Incident Event Manager (SIEM) completo para seu agente de IA que age como um Intrusion Detection System (IDS) que também alerta se sua IA começar a ficar maluca."


Fonte: u/sysinternalssuite no r/moltbot

📖 Leia a fonte completa: Reddit

Ad

👀 See Also

Coldkey: Geração de Chaves na Era Pós-Quântica e Ferramenta de Backup em Papel
Security

Coldkey: Geração de Chaves na Era Pós-Quântica e Ferramenta de Backup em Papel

Coldkey gera chaves age pós-quânticas (ML-KEM-768 + X25519) e produz backups HTML de página única para impressão com códigos QR para armazenamento offline.

OpenClawRadar
🦀
Security

Segurança de Agentes de IA: O Orçamento de Tokens Determina o Risco de Exfiltração de Dados

Um desenvolvedor testou agentes de IA conectados ao Gmail: modelos de ponta detectaram phishing, intermediários foram instáveis, modelos baratos encaminharam e-mails maliciosos silenciosamente. Proteções arquiteturais (sandbox, permissões) não impediram nenhuma tentativa.

OpenClawRadar
Claw Hub e Hugging Face atingidos por 575 pacotes de habilidades maliciosos
Security

Claw Hub e Hugging Face atingidos por 575 pacotes de habilidades maliciosos

Tanto o Claw Hub quanto o Hugging Face foram comprometidos, hospedando 575 pacotes de habilidades maliciosas. Os desenvolvedores são alertados a verificar qualquer habilidade que usem dessas plataformas.

OpenClawRadar
Hackerbot-Claw: Bot de IA Explorando Fluxos de Trabalho do GitHub Actions
Security

Hackerbot-Claw: Bot de IA Explorando Fluxos de Trabalho do GitHub Actions

Um bot alimentado por IA chamado hackerbot-claw executou uma campanha de ataque automatizada de uma semana contra pipelines de CI/CD, alcançando execução remota de código em pelo menos 4 de 6 alvos, incluindo projetos da Microsoft, DataDog e CNCF. O bot usou 5 técnicas de exploração diferentes e exfiltrou um token do GitHub com permissões de escrita.

OpenClawRadar