Agent-Drift : Outil de surveillance de sécurité pour agents IA

✍️ u/sysinternalssuite📅 Publié: February 7, 2026🔗 Source
Agent-Drift : Outil de surveillance de sécurité pour agents IA
Ad

Agent-Drift : Outil de surveillance de sécurité pour agents IA

Le spécialiste en cybersécurité sysinternalssuite a créé Agent-Drift – un outil open source pour protéger les agents IA contre l'injection de prompts, la dérive comportementale et d'autres attaques. Essentiellement un SIEM + IDS spécifiquement pour OpenClaw.

Pourquoi cela existe

« Je travaille dans la cybersécurité et j'ai remarqué une augmentation des injections de prompts, des dérives comportementales, des empoisonnements de mémoire et plus encore dans la nature avec les agents IA »

Ce que fait Agent-Drift

GitHub : https://github.com/lukehebe/Agent-Drift

L'outil fonctionne comme un wrapper pour OpenClaw :

  1. Collecte une ligne de base comportementale
  2. Détecte la dérive comportementale
  3. Alerte via un tableau de bord

Surveillance comportementale

Modèles suivis :

  • Séquences et fréquences d'utilisation des outils
  • Anomalies de timing
  • Modèles de décision
  • Caractéristiques de sortie
Ad

Détection d'attaques

Attaque Description
Substitution d'instructions Détournement de commande
Détournement de rôle Prise de contrôle de rôle
Tentatives de jailbreak Contournement de restrictions
Exfiltration de données Fuite de données
Charges utiles encodées Charges utiles obfusquées
Empoisonnement de mémoire Corruption de mémoire
Élévation de privilèges Élévation de droits
Injection indirecte de prompts Attaques indirectes

Comment cela fonctionne

  1. Apprentissage de base – les premières exécutions établissent un comportement normal
  2. Vecteurs comportementaux – chaque exécution devient un vecteur multidimensionnel
  3. Détection de dérive – les nouvelles exécutions sont comparées à la ligne de base
  4. Alertes d'anomalies – les écarts significatifs déclenchent des avertissements

TL;DR

« En gros, un Security Incident Event Manager (SIEM) tout-en-un pour votre agent IA qui agit comme un Intrusion Detection System (IDS) qui vous alerte également si votre IA commence à devenir folle. »


Source : u/sysinternalssuite sur r/moltbot

📖 Lire la source complète : Reddit

Ad

👀 See Also

OpenClaw 2026.3.28 corrige 8 vulnérabilités de sécurité, dont une critique d'élévation de privilèges.
Security

OpenClaw 2026.3.28 corrige 8 vulnérabilités de sécurité, dont une critique d'élévation de privilèges.

OpenClaw 2026.3.28 corrige 8 vulnérabilités de sécurité découvertes par Ant AI Security Lab, notamment une élévation de privilèges critique via /pair approve et une fuite de bac à sable de haute gravité dans l'outil message.

OpenClawRadar
Ward : un outil open source intercepte les installations npm pour bloquer les attaques de la chaîne d'approvisionnement pour les utilisateurs de Claude Code
Security

Ward : un outil open source intercepte les installations npm pour bloquer les attaques de la chaîne d'approvisionnement pour les utilisateurs de Claude Code

Ward est un outil open-source qui s'intègre aux gestionnaires de paquets pour vérifier chaque paquet avant l'exécution des scripts d'installation. Lorsque Claude Code exécute npm install, Ward analyse automatiquement les paquets à la recherche de logiciels malveillants, de typosquats, de scripts suspects et d'anomalies de version.

OpenClawRadar
Préoccupations concernant la confidentialité dans OpenClaw : Compétences, SOUL MD et communication entre agents
Security

Préoccupations concernant la confidentialité dans OpenClaw : Compétences, SOUL MD et communication entre agents

Un développeur soulève des préoccupations concernant la confidentialité dans l'architecture d'OpenClaw, notamment concernant l'accès illimité des compétences aux données sensibles, la nature modifiable du SOUL MD et le partage d'informations par les agents sans filtres.

OpenClawRadar
Passeport Agent : Vérification d'identité pour les agents IA
Security

Passeport Agent : Vérification d'identité pour les agents IA

Agent Passport est une couche de vérification d'identité open source utilisant l'authentification Ed25519 et des jetons JWT pour les agents IA, résolvant le problème de l'usurpation d'identité des agents.

OpenClawRadar