Agent-Drift : Outil de surveillance de sécurité pour agents IA

Agent-Drift : Outil de surveillance de sécurité pour agents IA
Le spécialiste en cybersécurité sysinternalssuite a créé Agent-Drift – un outil open source pour protéger les agents IA contre l'injection de prompts, la dérive comportementale et d'autres attaques. Essentiellement un SIEM + IDS spécifiquement pour OpenClaw.
Pourquoi cela existe
« Je travaille dans la cybersécurité et j'ai remarqué une augmentation des injections de prompts, des dérives comportementales, des empoisonnements de mémoire et plus encore dans la nature avec les agents IA »
Ce que fait Agent-Drift
GitHub : https://github.com/lukehebe/Agent-Drift
L'outil fonctionne comme un wrapper pour OpenClaw :
- Collecte une ligne de base comportementale
- Détecte la dérive comportementale
- Alerte via un tableau de bord
Surveillance comportementale
Modèles suivis :
- Séquences et fréquences d'utilisation des outils
- Anomalies de timing
- Modèles de décision
- Caractéristiques de sortie
Détection d'attaques
| Attaque | Description |
|---|---|
| Substitution d'instructions | Détournement de commande |
| Détournement de rôle | Prise de contrôle de rôle |
| Tentatives de jailbreak | Contournement de restrictions |
| Exfiltration de données | Fuite de données |
| Charges utiles encodées | Charges utiles obfusquées |
| Empoisonnement de mémoire | Corruption de mémoire |
| Élévation de privilèges | Élévation de droits |
| Injection indirecte de prompts | Attaques indirectes |
Comment cela fonctionne
- Apprentissage de base – les premières exécutions établissent un comportement normal
- Vecteurs comportementaux – chaque exécution devient un vecteur multidimensionnel
- Détection de dérive – les nouvelles exécutions sont comparées à la ligne de base
- Alertes d'anomalies – les écarts significatifs déclenchent des avertissements
TL;DR
« En gros, un Security Incident Event Manager (SIEM) tout-en-un pour votre agent IA qui agit comme un Intrusion Detection System (IDS) qui vous alerte également si votre IA commence à devenir folle. »
Source : u/sysinternalssuite sur r/moltbot
📖 Lire la source complète : Reddit
👀 See Also

OpenClaw 2026.3.28 corrige 8 vulnérabilités de sécurité, dont une critique d'élévation de privilèges.
OpenClaw 2026.3.28 corrige 8 vulnérabilités de sécurité découvertes par Ant AI Security Lab, notamment une élévation de privilèges critique via /pair approve et une fuite de bac à sable de haute gravité dans l'outil message.

Ward : un outil open source intercepte les installations npm pour bloquer les attaques de la chaîne d'approvisionnement pour les utilisateurs de Claude Code
Ward est un outil open-source qui s'intègre aux gestionnaires de paquets pour vérifier chaque paquet avant l'exécution des scripts d'installation. Lorsque Claude Code exécute npm install, Ward analyse automatiquement les paquets à la recherche de logiciels malveillants, de typosquats, de scripts suspects et d'anomalies de version.

Préoccupations concernant la confidentialité dans OpenClaw : Compétences, SOUL MD et communication entre agents
Un développeur soulève des préoccupations concernant la confidentialité dans l'architecture d'OpenClaw, notamment concernant l'accès illimité des compétences aux données sensibles, la nature modifiable du SOUL MD et le partage d'informations par les agents sans filtres.

Passeport Agent : Vérification d'identité pour les agents IA
Agent Passport est une couche de vérification d'identité open source utilisant l'authentification Ed25519 et des jetons JWT pour les agents IA, résolvant le problème de l'usurpation d'identité des agents.