Agent-Drift: Sicherheitsüberwachungstool für KI-Agenten

✍️ u/sysinternalssuite📅 Veröffentlicht: 7. Februar 2026🔗 Source

Agent-Drift: Sicherheitsüberwachungstool für KI-Agenten

Der Cybersecurity-Spezialist sysinternalssuite erstellte Agent-Drift—ein Open-Source-Tool zum Schutz von KI-Agenten vor Prompt-Injection, Verhaltensdrift und anderen Angriffen. Im Wesentlichen ein SIEM + IDS speziell für OpenClaw.

Warum Es Existiert

"Ich arbeite in der Cybersecurity und habe einen Anstieg von Prompt-Injection, Verhaltensdrift, Memory Poisoning und mehr bei KI-Agenten in freier Wildbahn bemerkt"

Was Agent-Drift Macht

GitHub: https://github.com/lukehebe/Agent-Drift

Das Tool funktioniert als Wrapper für OpenClaw:

Sammelt Verhaltens-Baseline
Erkennt Verhaltensdrift
Alarmiert über Dashboard

Verhaltensüberwachung

Verfolgte Muster:

Tool-Nutzungssequenzen und -frequenzen
Timing-Anomalien
Entscheidungsmuster
Output-Charakteristiken

Angriffserkennung

Angriff	Beschreibung
Instruktions-Override	Befehlsübernahme
Rollen-Hijacking	Rollenübernahme
Jailbreak-Versuche	Umgehung von Einschränkungen
Datenexfiltration	Datenleck
Kodierte Payloads	Verschleierte Payloads
Memory Poisoning	Speicherbeschädigung
Privilege Escalation	Rechteerweiterung
Indirekte Prompt-Injection	Indirekte Angriffe

Wie Es Funktioniert

Baseline-Lernen — erste Läufe etablieren normales Verhalten
Verhaltensvektoren — jeder Lauf wird zu multidimensionalem Vektor
Drift-Erkennung — neue Läufe werden mit Baseline verglichen
Anomalie-Warnungen — signifikante Abweichungen lösen Warnungen aus

TL;DR

"Im Grunde ein All-in-One SIEM für deinen KI-Agenten, der als IDS fungiert und dich auch warnt, wenn deine KI anfängt, verrückt zu werden."

Quelle: u/sysinternalssuite auf r/moltbot

📖 Vollständige Quelle lesen: Reddit

👀 Siehe auch

Sicherheit

jqwik v1.10.0 schleicht Prompt-Injection ein, die Code löscht, wenn von KI-Agenten verwendet wird

Johannes Link fügte jqwik v1.10.0 eine versteckte Anweisung hinzu, die KI-Coding-Agenten anweist, alle jqwik-Tests und -Codes zu löschen, versteckt mit ANSI-Escape-Sequenzen. Claude erkennt dies korrekt, aber menschliche Nutzer haben möglicherweise weniger Glück.

29. Mai 2026, 12:15 UTC

OpenClawRadar

Sicherheit

Agent-Pass: Identitätsverifizierung für KI-Agenten

Agent Passport ist eine Open-Source-Identitätsüberprüfungsschicht, die Ed25519-Authentifizierung und JWT-Token für KI-Agenten verwendet und das Problem der Identitätsanmaßung angeht.

21. Feb. 2026, 09:45 UTC

OpenClawRadar

Sicherheit

SCION: Die sichere Schweizer Alternative zum BGP-Routingprotokoll

SCION (Scalability, Control, and Isolation On Next-Generation Networks) ist eine Internet-Routing-Architektur, die an der ETH Zürich entwickelt wurde und die Grundlage von BGP durch integrierte Sicherheit und Multi-Path-Routing ersetzt. Im Gegensatz zu BGP-Patches wie RPKI und BGPsec etabliert SCION Dutzende oder Hunderte paralleler Pfade mit Millisekunden-Umleitung bei Ausfällen.

18. März 2026, 11:45 UTC

OpenClawRadar

Sicherheit

McpVanguard-Proxy blockiert OpenClaw-Fähigkeitsdaten-Exfiltration

Ein Entwickler hat McpVanguard erstellt, einen Proxy, der zwischen KI-Agenten und ihren Werkzeugen sitzt, um bösartige Aufrufketten wie Datendiebstahl zu blockieren. Dies erfolgte als Reaktion auf Ciscos Entdeckung, dass OpenClaw-Fähigkeiten heimlichen Datendiebstahl durchführen. Es nutzt Mustererkennung, semantische Absichtsbewertung und Verhaltensketten-Erkennung.

20. März 2026, 20:45 UTC

OpenClawRadar