KnightClaw: Lokale Sicherheitserweiterung für OpenClaw-Agenten

KnightClaw ist eine Sicherheitserweiterung, die OpenClaw-KI-Codierungsagenten vor adversarischen Eingabeaufforderungen schützt. Das Tool adressiert ein spezifisches Bedrohungsmodell, bei dem eine einzige bösartige Nachricht im Kontextfenster dazu führen kann, dass ein Agent Anweisungen des Angreifers statt Benutzerbefehlen folgt.
Kernfunktionen
KnightClaw funktioniert als Plug-and-Play-Erweiterung ohne erforderliche Konfiguration, ohne API-Schlüssel und ohne Cloud-Abhängigkeit. Es fängt jede Nachricht ab, bevor sie den Agenten erreicht.
Erkennungssystem
Die Schutzfunktion verwendet einen 8-Schichten-Hybrid-Erkennungsansatz:
- Regex-Muster
- Homoglyphen-Erkennung
- Grenztoken-Analyse
- Perplexity-Bewertung
- Entropie-Analyse
- Heuristiken
- Semantische Einbettungen (unter Verwendung eines lokalen, quantisierten BGE-Modells)
Blockierungen erfolgen in Mikrosekunden.
Zusätzliche Sicherheitsmaßnahmen
- Ausgangsredaktion: Entfernt Geheimnisse aus ausgehenden Antworten, bevor sie den Agenten verlassen
- Hash-verkettete Prüfprotokolle: Manipulationssichere, nur-anhängende Protokolle mit vollständiger Zeitleiste jeder Blockierung, Zulassung und Konfigurationsänderung
- Geschwindigkeits-Schutzschalter: 10 Blockierungen in 60 Sekunden lösen automatische Sperrung ohne manuelles Eingreifen aus
- Notausschalter: Ein Befehl stoppt alles:
openclaw knight lockdown on
Technische Details
Die Erweiterung läuft vollständig lokal ohne jegliche Telemetrie und ist unter der MIT-Lizenz lizenziert. Der Quellcode ist für Tests und Beiträge verfügbar.
📖 Read the full source: r/openclaw
👀 Siehe auch

OpenClaw Sicherheitsaudit: Befehlsaufforderungen für verständliche Schwachstellenberichte
Ein Reddit-Nutzer teilte einen Prompt für die OpenClaw CLI, der eine tiefgehende Sicherheitsprüfung durchführt und die Ergebnisse in einfachem Englisch ausgibt, mit Angaben zu offengelegten Schwachstellen, Schweregraden und konkreten Konfigurationskorrekturen.

Clawvisor: Zweckbasierte Autorisierungsschicht für OpenClaw-Agenten
Clawvisor ist eine Autorisierungsschicht, die zwischen KI-Agenten und APIs sitzt und zweckbasierte Autorisierung durchsetzt, bei der Agenten Absichten deklarieren, Benutzer bestimmte Zwecke genehmigen und ein KI-Gatekeeper jede Anfrage gegen diesen Zweck überprüft. Anmeldedaten verlassen Clawvisor nie und Agenten sehen sie nie.

Claudes Sicherheitsüberprüfungsbefehl hat Einschränkungen für Produktionssysteme
Ein Entwickler fand Claudes Sicherheitsüberprüfungsbefehl hilfreich für grundlegende Validierungen wie MIME-Typen und Dateigrößenbeschränkungen, jedoch unzureichend für die Produktionshärtung gegen ausgeklügelte Bedrohungen. Die Lösung erforderte eine zweiwöchige Architekturüberholung, bei der die Dateiverarbeitung in einen eingeschränkten Worker mit begrenzten Berechtigungen ausgelagert wurde.

Passen Sie Ihr OpenClaw an: Kosten sparen und Sicherheit verbessern
Entdecken Sie, wie Sie Ihren OpenClaw anpassen können, um nicht nur Geld zu sparen, sondern auch die Sicherheit zu erhöhen, wie im r/openclaw-Subreddit diskutiert.