Bedrohungsdaten aus 91.000 KI-Agenten-Interaktionen: Tool-Missbrauch um 6,4 % gestiegen, neue multimodale Angriffe

✍️ OpenClawRadar📅 Veröffentlicht: 24. Februar 2026🔗 Source
Bedrohungsdaten aus 91.000 KI-Agenten-Interaktionen: Tool-Missbrauch um 6,4 % gestiegen, neue multimodale Angriffe
Ad

Bedrohungslage aus Produktionsdaten von KI-Agenten

Echtzeit-Bedrohungsdaten von 91.284 KI-Agenten-Interaktionen aus 47 Bereitstellungen zeigen 35.711 erkannte Bedrohungen im Februar 2026. Das Erkennungsmodell verwendet einen Gemma-basierten 5-Kopf-Multilabel-Klassifikator.

Wichtige Bedrohungen für selbst gehostete Bereitstellungen

  • Missbrauch von Tools/Befehlen: Um 6,4 % auf 14,5 % der Bedrohungen gestiegen. Das vorherrschende Muster ist die Eskalation von Tool-Ketten, bei der ein harmloser Lesezugriff von einem Schreib- oder Ausführungszugriff gefolgt wird. Die meisten lokalen Einrichtungen gewähren Agenten Tool-Zugriff ohne ausreichende Sicherheitsvorkehrungen.
  • Agentenziel-Übernahme: Hat sich auf 6,9 % der Bedrohungen verdoppelt. Zielt auf die Planungsphase in autonomen Agenten-Schleifen ab, was besonders für lokale Einrichtungen mit weniger Überwachung des Agentenzustands relevant ist.
  • RAG-Poisoning: Hat sich auf Metadaten-Angriffe bei 12,0 % verlagert (vorher 10,0 %). Das neue Muster zielt auf Dokumenten-Metadaten (Titel, Autoren, Anmerkungen) anstatt auf Inhalte ab. Die meisten Personen bereinigen Inhalte, lassen Metadaten jedoch unverändert durch.
  • Multimodale Injektion: Neue Bedrohung bei 2,3 %, bei der Anweisungen in Bildern und PDFs versteckt werden. Reine Text-Sicherheitsüberprüfungen übersehen diese Angriffe.
Ad

Prozentuale Aufschlüsselung der Bedrohungen

  • Datenexfiltration: 18,0 % (-1,2 MoM-Änderung)
  • Missbrauch von Tools/Befehlen: 14,5 % (+6,4)
  • RAG/Kontext-Angriff: 12,0 % (+2,0)
  • Jailbreak: 11,0 % (-1,3)
  • Prompt-Injektion: 8,1 % (-0,7)
  • Agentenziel-Übernahme: 6,9 % (+3,3)
  • Inter-Agenten-Angriff: 5,0 % (+1,6)

Erkennungsansatz

Die Erkennungspipeline verwendet zwei Ebenen: L1 ist Mustererkennung mit 218 Regeln (Sub-ms-Latenz, läuft vollständig lokal), und L2 ist Gemma-basiert. Die vollständige Community Edition ist Open Source unter github.com/raxe-ai/raxe-ce.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Ward: Open-Source-Tool fängt npm-Installs ab, um Lieferkettenangriffe für Claude Code-Nutzer zu blockieren
Sicherheit

Ward: Open-Source-Tool fängt npm-Installs ab, um Lieferkettenangriffe für Claude Code-Nutzer zu blockieren

Ward ist ein Open-Source-Tool, das sich in Paketmanager einklinkt, um jedes Paket zu überprüfen, bevor Installationsskripte ausgeführt werden. Wenn Claude Code npm install ausführt, scannt Ward automatisch Pakete auf Malware, Typosquatting, verdächtige Skripte und Versionsanomalien.

OpenClawRadar
OpenClaw-Sicherheitsbedenken: API-Schlüssel und Konversationsdaten im Standard-Selbsthosting gefährdet
Sicherheit

OpenClaw-Sicherheitsbedenken: API-Schlüssel und Konversationsdaten im Standard-Selbsthosting gefährdet

Ein Cisco-Bericht weist darauf hin, dass die OpenClaw-Sicherheit "optional, nicht eingebaut" ist, wobei Standardkonfigurationen API-Schlüssel in .env-Dateien auf VPS-Instanzen speichern, was potenzielle Sicherheitslücken für nicht-technische Nutzer auf einfachen Droplets schafft.

OpenClawRadar
Erkundung der Risiken der Nutzung eines Google-Kontos mit Gemini-Cli und Gemini Pro-Abonnement
Sicherheit

Erkundung der Risiken der Nutzung eines Google-Kontos mit Gemini-Cli und Gemini Pro-Abonnement

Gemini-Cli und Ihr Gemini Pro-Abonnement könnten einige Risiken für Ihr Google-Konto darstellen. Hier erfahren Sie, was Sie über mögliche Schwachstellen im Umgang mit diesen KI-Tools wissen müssen.

OpenClawRadar
Sunder: Eine Rust-basierte lokale Datenschutz-Firewall für LLMs
Sicherheit

Sunder: Eine Rust-basierte lokale Datenschutz-Firewall für LLMs

Sunder ist eine Chrome-Erweiterung, die als lokale Datenschutz-Firewall für KI-Chats fungiert und mit Rust und WebAssembly erstellt wurde, um sicherzustellen, dass keine sensiblen Daten Ihren Browser verlassen.

OpenClawRadar