Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA

✍️ u/sysinternalssuite📅 Publicado: 7 de febrero de 2026🔗 Source

Agent-Drift: Herramienta de Monitoreo de Seguridad para Agentes de IA

El especialista en ciberseguridad sysinternalssuite creó Agent-Drift—una herramienta open source para proteger agentes de IA de inyección de prompts, deriva comportamental y otros ataques. Esencialmente un SIEM + IDS específicamente para OpenClaw.

Por Qué Existe

"Trabajo en Ciberseguridad y he notado un aumento en inyección de prompts, deriva comportamental, envenenamiento de memoria y más en agentes de IA en producción"

Qué Hace Agent-Drift

GitHub: https://github.com/lukehebe/Agent-Drift

La herramienta funciona como un wrapper para OpenClaw:

Recopila línea base de comportamiento
Detecta deriva comportamental
Alerta a través del dashboard

Monitoreo de Comportamiento

Patrones rastreados:

Secuencias y frecuencias de uso de herramientas
Anomalías de tiempo
Patrones de decisión
Características de salida

Detección de Ataques

Ataque	Descripción
Override de instrucciones	Secuestro de comandos
Secuestro de rol	Toma de control de rol
Intentos de jailbreak	Bypass de restricciones
Exfiltración de datos	Fuga de datos
Payloads codificados	Payloads ofuscados
Envenenamiento de memoria	Corrupción de memoria
Escalada de privilegios	Elevación de derechos
Inyección indirecta de prompt	Ataques indirectos

Cómo Funciona

Aprendizaje de línea base — primeras ejecuciones establecen comportamiento normal
Vectores comportamentales — cada ejecución se convierte en vector multidimensional
Detección de deriva — nuevas ejecuciones comparadas contra línea base
Alertas de anomalías — desviaciones significativas disparan advertencias

TL;DR

"Básicamente un SIEM todo-en-uno para tu agente de IA que actúa como un IDS que también te alerta si tu IA empieza a volverse loca."

Fuente: u/sysinternalssuite en r/moltbot

📖 Leer la fuente completa: Reddit

👀 Ver también

Seguridad

Investigadores de Seguridad en IA: Tus Vulnerabilidades de Día Cero Podrían Filtrarse a través de la Opción de Inclusión de Datos

El interruptor 'Mejorar el modelo para todos' en las interfaces de LLM puede recolectar automáticamente investigaciones profundas de red-teaming, enviando tus conceptos de vulnerabilidad a los equipos de seguridad de los proveedores y potencialmente a artículos académicos antes de que publiques. Desactiva el intercambio de datos antes de realizar investigaciones de seguridad serias.

27 feb 2026, 19:45 UTC

OpenClawRadar

Seguridad

Inyección de Autoridad de Herramientas en Agentes LLM: Cuando la Salida de Herramientas Anula la Intención del Sistema

Un investigador demuestra 'Inyección de Autoridad de Herramientas' en un laboratorio local de agentes LLM, mostrando cómo la salida confiable de herramientas puede elevarse al nivel de autoridad de políticas, cambiando silenciosamente el comportamiento del agente mientras el sandbox y el acceso a archivos permanecen seguros.

7 mar 2026, 15:45 UTC

OpenClawRadar

Seguridad

Nullgaze: Se lanza un escáner de seguridad respaldado por IA de código abierto.

Nullgaze es un nuevo escáner de seguridad de código abierto respaldado por IA que detecta vulnerabilidades específicas del código generado por IA, con casi cero falsos positivos.

13 feb 2026, 05:45 UTC

OpenClawRadar

Seguridad

Vulnerabilidades Críticas de Seguridad en OpenClaw Parcheadas el 28.3.2026.

La versión 2026.3.28 de OpenClaw corrige 8 vulnerabilidades críticas de seguridad descubiertas por Ant AI Security Lab, incluyendo omisión de sandbox, escalada de privilegios y riesgos de SSRF. Los usuarios con versiones ≤2026.3.24 deben actualizar inmediatamente.

1 abr 2026, 19:45 UTC

OpenClawRadar