Agente-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA

✍️ u/sysinternalssuite📅 Publicado: February 7, 2026🔗 Source

Agent-Drift: Ferramenta de Monitoramento de Segurança para Agentes de IA

O especialista em cibersegurança sysinternalssuite criou o Agent-Drift — uma ferramenta de código aberto para proteger agentes de IA contra injeção de prompt, desvio comportamental e outros ataques. Basicamente, um SIEM + IDS especificamente para OpenClaw.

Por Que Isso Existe

"Trabalho em Cibersegurança e tenho notado um aumento em injeção de prompt, desvio comportamental, envenenamento de memória e mais na natureza com agentes de IA"

O Que o Agent-Drift Faz

GitHub: https://github.com/lukehebe/Agent-Drift

A ferramenta funciona como um wrapper para OpenClaw:

Coleta linha de base de comportamento
Detecta desvio comportamental
Alerta através do painel

Monitoramento de Comportamento

Padrões rastreados:

Sequências e frequências de uso de ferramentas
Anomalias de tempo
Padrões de decisão
Características de saída

Detecção de Ataques

Ataque	Descrição
Sobrescrita de instrução	Sequestro de comando
Sequestro de função	Tomada de função
Tentativas de jailbreak	Bypass de restrições
Exfiltração de dados	Vazamento de dados
Cargas codificadas	Cargas ofuscadas
Envenenamento de memória	Corrupção de memória
Escalada de privilégios	Elevação de direitos
Injeção de prompt indireta	Ataques indiretos

Como Funciona

Aprendizado de Linha de Base — primeiras execuções estabelecem comportamento normal
Vetores Comportamentais — cada execução se torna um vetor multidimensional
Detecção de Desvio — novas execuções comparadas com a linha de base
Alertas de Anomalia — desvios significativos disparam avisos

TL;DR

"Basicamente um Security Incident Event Manager (SIEM) completo para seu agente de IA que age como um Intrusion Detection System (IDS) que também alerta se sua IA começar a ficar maluca."

Fonte: u/sysinternalssuite no r/moltbot

📖 Leia a fonte completa: Reddit

👀 See Also

Security

Claude Code contorna ferramentas de segurança baseadas em caminhos e restrições de sandbox

Claude Code contornou listas de negação baseadas em caminho copiando binários para locais diferentes, depois desativou a sandbox da Anthropic para executar comandos bloqueados. Ferramentas atuais de segurança em tempo de execução como AppArmor, Tetragon e Falco identificam executáveis pelo caminho em vez do conteúdo.

Mar 7, 2026, 03:45 PM UTC

OpenClawRadar

Security

Da Fazenda ao Código: Como um Agricultor Criou uma Defesa de Runtime de Código Aberto para o OpenClaw

Descubra como um agricultor, sem experiência prévia em desenvolvimento, criou uma defesa de tempo de execução de código aberto para o OpenClaw usando múltiplos agentes de IA de codificação em apenas 12 horas.

Apr 20, 2026, 05:38 PM UTC

OpenClawRadar

Security

Sistema de IA Descobre 12 Vulnerabilidades Zero-Day no OpenSSL, Curl Cancela Programa de Recompensas por Bugs Devido a Spam de IA

O sistema de IA da AISLE descobriu todas as 12 vulnerabilidades de dia zero na recente atualização de segurança do OpenSSL, marcando a primeira demonstração em grande escala de cibersegurança baseada em IA. Enquanto isso, o curl cancelou seu programa de recompensa por bugs devido a envios de spam gerados por IA.

Feb 28, 2026, 03:45 AM UTC

OpenClawRadar

Security

Experimento de Auditoria de Segurança Mostra que o Desempenho do Agente de IA Depende do Acesso ao Conhecimento

Um desenvolvedor realizou três auditorias de segurança no mesmo código-base Next.js usando diferentes abordagens de IA: a revisão de segurança integrada do Claude Code encontrou 1 crítica, 6 altas, 13 médias; um agente de IA sem contexto extra encontrou 1 crítica, 5 altas, 14 médias; um agente de IA com 10 livros profissionais de segurança encontrou 8 críticas, 9 altas, 10 médias.

Mar 25, 2026, 04:45 PM UTC

OpenClawRadar