Agent-Drift : Outil de surveillance de sécurité pour agents IA

Le spécialiste en cybersécurité sysinternalssuite a créé Agent-Drift – un outil open source pour protéger les agents IA contre l'injection de prompts, la dérive comportementale et d'autres attaques. Essentiellement un SIEM + IDS spécifiquement pour OpenClaw.

Pourquoi cela existe

« Je travaille dans la cybersécurité et j'ai remarqué une augmentation des injections de prompts, des dérives comportementales, des empoisonnements de mémoire et plus encore dans la nature avec les agents IA »

Ce que fait Agent-Drift

GitHub : https://github.com/lukehebe/Agent-Drift

L'outil fonctionne comme un wrapper pour OpenClaw :

Collecte une ligne de base comportementale
Détecte la dérive comportementale
Alerte via un tableau de bord

Surveillance comportementale

Modèles suivis :

Séquences et fréquences d'utilisation des outils
Anomalies de timing
Modèles de décision
Caractéristiques de sortie

Détection d'attaques

Attaque	Description
Substitution d'instructions	Détournement de commande
Détournement de rôle	Prise de contrôle de rôle
Tentatives de jailbreak	Contournement de restrictions
Exfiltration de données	Fuite de données
Charges utiles encodées	Charges utiles obfusquées
Empoisonnement de mémoire	Corruption de mémoire
Élévation de privilèges	Élévation de droits
Injection indirecte de prompts	Attaques indirectes

Comment cela fonctionne

Apprentissage de base – les premières exécutions établissent un comportement normal
Vecteurs comportementaux – chaque exécution devient un vecteur multidimensionnel
Détection de dérive – les nouvelles exécutions sont comparées à la ligne de base
Alertes d'anomalies – les écarts significatifs déclenchent des avertissements

TL;DR

« En gros, un Security Incident Event Manager (SIEM) tout-en-un pour votre agent IA qui agit comme un Intrusion Detection System (IDS) qui vous alerte également si votre IA commence à devenir folle. »

Source : u/sysinternalssuite sur r/moltbot

📖 Lire la source complète : Reddit