KnightClaw: Lokale Sicherheitserweiterung für OpenClaw-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 23. Februar 2026🔗 Source

KnightClaw ist eine Sicherheitserweiterung, die OpenClaw-KI-Codierungsagenten vor adversarischen Eingabeaufforderungen schützt. Das Tool adressiert ein spezifisches Bedrohungsmodell, bei dem eine einzige bösartige Nachricht im Kontextfenster dazu führen kann, dass ein Agent Anweisungen des Angreifers statt Benutzerbefehlen folgt.

Kernfunktionen

KnightClaw funktioniert als Plug-and-Play-Erweiterung ohne erforderliche Konfiguration, ohne API-Schlüssel und ohne Cloud-Abhängigkeit. Es fängt jede Nachricht ab, bevor sie den Agenten erreicht.

Erkennungssystem

Die Schutzfunktion verwendet einen 8-Schichten-Hybrid-Erkennungsansatz:

Regex-Muster
Homoglyphen-Erkennung
Grenztoken-Analyse
Perplexity-Bewertung
Entropie-Analyse
Heuristiken
Semantische Einbettungen (unter Verwendung eines lokalen, quantisierten BGE-Modells)

Blockierungen erfolgen in Mikrosekunden.

Zusätzliche Sicherheitsmaßnahmen

Ausgangsredaktion: Entfernt Geheimnisse aus ausgehenden Antworten, bevor sie den Agenten verlassen
Hash-verkettete Prüfprotokolle: Manipulationssichere, nur-anhängende Protokolle mit vollständiger Zeitleiste jeder Blockierung, Zulassung und Konfigurationsänderung
Geschwindigkeits-Schutzschalter: 10 Blockierungen in 60 Sekunden lösen automatische Sperrung ohne manuelles Eingreifen aus
Notausschalter: Ein Befehl stoppt alles: openclaw knight lockdown on

Technische Details

Die Erweiterung läuft vollständig lokal ohne jegliche Telemetrie und ist unter der MIT-Lizenz lizenziert. Der Quellcode ist für Tests und Beiträge verfügbar.

📖 Read the full source: r/openclaw

👀 Siehe auch

Sicherheit

Versteckte Audiosignale kapern Sprach-KI-Systeme mit 79-96% Erfolgsrate

Forschung zeigt, dass unhörbare Audio-Clips LALMs dazu zwingen können, unbefugte Befehle wie Websuchen, Dateidownloads und E-Mail-Exfiltration mit einer Erfolgsrate von 79-96 % bei 13 Modellen, darunter Mistral und Microsoft-Dienste, auszuführen.

18. Mai 2026, 22:15 UTC

OpenClawRadar

Sicherheit

Entwickler baut Firecracker MicroVM-Sandbox für OpenClaw Security

Ein Entwickler, der sich um die Sicherheit von LLMs sorgte, baute eine Bare-Metal-Sandbox mit Firecracker-MicroVMs, um OpenClaw-Skripte zu isolieren, wobei jedes Skript in seinem eigenen Linux-Kernel mit einer RAM-Begrenzung von 128 MB und standardmäßig ohne Netzwerkzugriff läuft.

30. März 2026, 09:45 UTC

OpenClawRadar

Sicherheit

OpenClaw Skill-Sicherheitsscanner: 7,6 % von 31.371 Skills als gefährlich eingestuft

Ein Entwickler hat ein Tool erstellt, das das gesamte ClawHub-Register durchsucht und festgestellt hat, dass 2.371 von 31.371 Skills gefährliche Muster wie Wallet-Drainer, Diebstahl von Zugangsdaten und Prompt-Injection enthalten. Das Tool bietet API-Zugang und Badges zur Überprüfung von Skills vor der Installation.

24. März 2026, 17:45 UTC

OpenClawRadar

Sicherheit

Betrugswarnung: Gefälschtes GitHub-Airdrop zielt auf CLAW-Token-Nutzer ab

Ein Phishing-Betrug kursiert, der angeblich $CLAW-Token-Airdrops für GitHub-Beiträge anbietet. Der Betrug nutzt einen Google-Share-Link, der auf eine verdächtige .xyz-Website weiterleitet und Benutzer auffordert, ihre Wallets zu verbinden, was möglicherweise zum Leeren der Wallets führt.

18. März 2026, 18:45 UTC

OpenClawRadar