KnightClaw: Lokale Sicherheitserweiterung für OpenClaw-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 23. Februar 2026🔗 Source
KnightClaw: Lokale Sicherheitserweiterung für OpenClaw-Agenten
Ad

KnightClaw ist eine Sicherheitserweiterung, die OpenClaw-KI-Codierungsagenten vor adversarischen Eingabeaufforderungen schützt. Das Tool adressiert ein spezifisches Bedrohungsmodell, bei dem eine einzige bösartige Nachricht im Kontextfenster dazu führen kann, dass ein Agent Anweisungen des Angreifers statt Benutzerbefehlen folgt.

Kernfunktionen

KnightClaw funktioniert als Plug-and-Play-Erweiterung ohne erforderliche Konfiguration, ohne API-Schlüssel und ohne Cloud-Abhängigkeit. Es fängt jede Nachricht ab, bevor sie den Agenten erreicht.

Erkennungssystem

Die Schutzfunktion verwendet einen 8-Schichten-Hybrid-Erkennungsansatz:

  • Regex-Muster
  • Homoglyphen-Erkennung
  • Grenztoken-Analyse
  • Perplexity-Bewertung
  • Entropie-Analyse
  • Heuristiken
  • Semantische Einbettungen (unter Verwendung eines lokalen, quantisierten BGE-Modells)

Blockierungen erfolgen in Mikrosekunden.

Ad

Zusätzliche Sicherheitsmaßnahmen

  • Ausgangsredaktion: Entfernt Geheimnisse aus ausgehenden Antworten, bevor sie den Agenten verlassen
  • Hash-verkettete Prüfprotokolle: Manipulationssichere, nur-anhängende Protokolle mit vollständiger Zeitleiste jeder Blockierung, Zulassung und Konfigurationsänderung
  • Geschwindigkeits-Schutzschalter: 10 Blockierungen in 60 Sekunden lösen automatische Sperrung ohne manuelles Eingreifen aus
  • Notausschalter: Ein Befehl stoppt alles: openclaw knight lockdown on

Technische Details

Die Erweiterung läuft vollständig lokal ohne jegliche Telemetrie und ist unter der MIT-Lizenz lizenziert. Der Quellcode ist für Tests und Beiträge verfügbar.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

OpenClaw Sicherheitsaudit: Befehlsaufforderungen für verständliche Schwachstellenberichte
Sicherheit

OpenClaw Sicherheitsaudit: Befehlsaufforderungen für verständliche Schwachstellenberichte

Ein Reddit-Nutzer teilte einen Prompt für die OpenClaw CLI, der eine tiefgehende Sicherheitsprüfung durchführt und die Ergebnisse in einfachem Englisch ausgibt, mit Angaben zu offengelegten Schwachstellen, Schweregraden und konkreten Konfigurationskorrekturen.

OpenClawRadar
Clawvisor: Zweckbasierte Autorisierungsschicht für OpenClaw-Agenten
Sicherheit

Clawvisor: Zweckbasierte Autorisierungsschicht für OpenClaw-Agenten

Clawvisor ist eine Autorisierungsschicht, die zwischen KI-Agenten und APIs sitzt und zweckbasierte Autorisierung durchsetzt, bei der Agenten Absichten deklarieren, Benutzer bestimmte Zwecke genehmigen und ein KI-Gatekeeper jede Anfrage gegen diesen Zweck überprüft. Anmeldedaten verlassen Clawvisor nie und Agenten sehen sie nie.

OpenClawRadar
Claudes Sicherheitsüberprüfungsbefehl hat Einschränkungen für Produktionssysteme
Sicherheit

Claudes Sicherheitsüberprüfungsbefehl hat Einschränkungen für Produktionssysteme

Ein Entwickler fand Claudes Sicherheitsüberprüfungsbefehl hilfreich für grundlegende Validierungen wie MIME-Typen und Dateigrößenbeschränkungen, jedoch unzureichend für die Produktionshärtung gegen ausgeklügelte Bedrohungen. Die Lösung erforderte eine zweiwöchige Architekturüberholung, bei der die Dateiverarbeitung in einen eingeschränkten Worker mit begrenzten Berechtigungen ausgelagert wurde.

OpenClawRadar
Passen Sie Ihr OpenClaw an: Kosten sparen und Sicherheit verbessern
Sicherheit

Passen Sie Ihr OpenClaw an: Kosten sparen und Sicherheit verbessern

Entdecken Sie, wie Sie Ihren OpenClaw anpassen können, um nicht nur Geld zu sparen, sondern auch die Sicherheit zu erhöhen, wie im r/openclaw-Subreddit diskutiert.

OpenClawRadar