Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA

✍️ u/sysinternalssuite📅 Publicado: 7 de febrero de 2026🔗 Source
Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA
Ad

Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA

El especialista en ciberseguridad sysinternalssuite creó Agent-Drift—una herramienta open source para proteger agentes de IA de inyección de prompts, deriva comportamental y otros ataques. Esencialmente un SIEM + IDS específicamente para OpenClaw.

Por Qué Existe

"Trabajo en Ciberseguridad y he notado un aumento en inyección de prompts, deriva comportamental, envenenamiento de memoria y más en agentes de IA en producción"

Qué Hace Agent-Drift

GitHub: https://github.com/lukehebe/Agent-Drift

La herramienta funciona como un wrapper para OpenClaw:

  1. Recopila línea base de comportamiento
  2. Detecta deriva comportamental
  3. Alerta a través del dashboard

Monitoreo de Comportamiento

Patrones rastreados:

  • Secuencias y frecuencias de uso de herramientas
  • Anomalías de tiempo
  • Patrones de decisión
  • Características de salida
Ad

Detección de Ataques

Ataque Descripción
Override de instrucciones Secuestro de comandos
Secuestro de rol Toma de control de rol
Intentos de jailbreak Bypass de restricciones
Exfiltración de datos Fuga de datos
Payloads codificados Payloads ofuscados
Envenenamiento de memoria Corrupción de memoria
Escalada de privilegios Elevación de derechos
Inyección indirecta de prompt Ataques indirectos

Cómo Funciona

  1. Aprendizaje de línea base — primeras ejecuciones establecen comportamiento normal
  2. Vectores comportamentales — cada ejecución se convierte en vector multidimensional
  3. Detección de deriva — nuevas ejecuciones comparadas contra línea base
  4. Alertas de anomalías — desviaciones significativas disparan advertencias

TL;DR

"Básicamente un SIEM todo-en-uno para tu agente de IA que actúa como un IDS que también te alerta si tu IA empieza a volverse loca."


Fuente: u/sysinternalssuite en r/moltbot

📖 Leer la fuente completa: Reddit

Ad

👀 Ver también

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA
Seguridad

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA

Sieve escanea los historiales de chat de Cursor, Claude Code, Copilot y otros asistentes de codificación con IA en busca de claves API y tokens filtrados. Todo el escaneo es local, con redacción y bóveda de llavero de macOS.

OpenClawRadar
ClawCare: Guardián de Seguridad para Agentes de Codificación de IA Tras Fuga de Claves de AWS
Seguridad

ClawCare: Guardián de Seguridad para Agentes de Codificación de IA Tras Fuga de Claves de AWS

ClawCare es una herramienta de Python que escanea comandos antes de su ejecución en agentes de codificación con IA como Claude Code, bloqueando patrones riesgosos como volcados masivos de entorno y shells inversos. Fue creada después de que un desarrollador filtrara accidentalmente una clave de AWS a través de un agente.

OpenClawRadar
Claude Code continúa registrando sesiones después de la revocación, usuarios reportan silencio de soporte de 2 semanas
Seguridad

Claude Code continúa registrando sesiones después de la revocación, usuarios reportan silencio de soporte de 2 semanas

Un usuario de Claude Code informa que los registros de sesión continuaron apareciendo después de revocar el acceso, con el soporte de Anthropic sin respuesta durante dos semanas. Los registros incluían alcances como user:file_upload, user:ccr_inference y user:sessions:claude_code.

OpenClawRadar
OpenClaw Skill Analyzer: Escáner de Seguridad Estática para Habilidades de Agentes de IA
Seguridad

OpenClaw Skill Analyzer: Escáner de Seguridad Estática para Habilidades de Agentes de IA

Un desarrollador creó un analizador estático que escanea las habilidades de OpenClaw en busca de riesgos de seguridad antes de la instalación, con más de 40 reglas de detección en 12 categorías que incluyen inyección de prompts y exfiltración de datos.

OpenClawRadar