Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA

Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA
El especialista en ciberseguridad sysinternalssuite creó Agent-Drift—una herramienta open source para proteger agentes de IA de inyección de prompts, deriva comportamental y otros ataques. Esencialmente un SIEM + IDS específicamente para OpenClaw.
Por Qué Existe
"Trabajo en Ciberseguridad y he notado un aumento en inyección de prompts, deriva comportamental, envenenamiento de memoria y más en agentes de IA en producción"
Qué Hace Agent-Drift
GitHub: https://github.com/lukehebe/Agent-Drift
La herramienta funciona como un wrapper para OpenClaw:
- Recopila línea base de comportamiento
- Detecta deriva comportamental
- Alerta a través del dashboard
Monitoreo de Comportamiento
Patrones rastreados:
- Secuencias y frecuencias de uso de herramientas
- Anomalías de tiempo
- Patrones de decisión
- Características de salida
Detección de Ataques
| Ataque | Descripción |
|---|---|
| Override de instrucciones | Secuestro de comandos |
| Secuestro de rol | Toma de control de rol |
| Intentos de jailbreak | Bypass de restricciones |
| Exfiltración de datos | Fuga de datos |
| Payloads codificados | Payloads ofuscados |
| Envenenamiento de memoria | Corrupción de memoria |
| Escalada de privilegios | Elevación de derechos |
| Inyección indirecta de prompt | Ataques indirectos |
Cómo Funciona
- Aprendizaje de línea base — primeras ejecuciones establecen comportamiento normal
- Vectores comportamentales — cada ejecución se convierte en vector multidimensional
- Detección de deriva — nuevas ejecuciones comparadas contra línea base
- Alertas de anomalías — desviaciones significativas disparan advertencias
TL;DR
"Básicamente un SIEM todo-en-uno para tu agente de IA que actúa como un IDS que también te alerta si tu IA empieza a volverse loca."
Fuente: u/sysinternalssuite en r/moltbot
📖 Leer la fuente completa: Reddit
👀 Ver también

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA
Sieve escanea los historiales de chat de Cursor, Claude Code, Copilot y otros asistentes de codificación con IA en busca de claves API y tokens filtrados. Todo el escaneo es local, con redacción y bóveda de llavero de macOS.

ClawCare: Guardián de Seguridad para Agentes de Codificación de IA Tras Fuga de Claves de AWS
ClawCare es una herramienta de Python que escanea comandos antes de su ejecución en agentes de codificación con IA como Claude Code, bloqueando patrones riesgosos como volcados masivos de entorno y shells inversos. Fue creada después de que un desarrollador filtrara accidentalmente una clave de AWS a través de un agente.

Claude Code continúa registrando sesiones después de la revocación, usuarios reportan silencio de soporte de 2 semanas
Un usuario de Claude Code informa que los registros de sesión continuaron apareciendo después de revocar el acceso, con el soporte de Anthropic sin respuesta durante dos semanas. Los registros incluían alcances como user:file_upload, user:ccr_inference y user:sessions:claude_code.

OpenClaw Skill Analyzer: Escáner de Seguridad Estática para Habilidades de Agentes de IA
Un desarrollador creó un analizador estático que escanea las habilidades de OpenClaw en busca de riesgos de seguridad antes de la instalación, con más de 40 reglas de detección en 12 categorías que incluyen inyección de prompts y exfiltración de datos.