BlindKey: Blinde Anmeldeinformationen-Injektion für KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 13. April 2026🔗 Source

Wie BlindKey funktioniert

BlindKey adressiert das Sicherheitsrisiko, dass KI-Agenten mit Klartext-API-Zugangsdaten umgehen. Anstatt Agenten direkten Zugriff auf Geheimnisse zu geben, verwendet es ein System, bei dem Agenten auf verschlüsselte Vault-Token verweisen (z.B. bk://stripe). Ein lokaler Proxy fängt diese Verweise ab und injiziert die tatsächliche Zugangsdaten genau in dem Moment, in dem die API-Anfrage gestellt wird. Der Agentenprozess sieht oder speichert das Klartext-Geheimnis niemals.

Sicherheitsfunktionen

AES-256-GCM-Verschlüsselung für ruhende Daten
Domain-Allowlisting pro Geheimnis (z.B. ein Stripe-Schlüssel kann nur mit api.stripe.com verwendet werden)
Standardmäßig verweigernde Dateisystem-Tore
Inhaltsüberprüfung bei Agenten-Schreibvorgängen, um versehentlich preisgegebene Zugangsdaten oder PII zu erkennen
Manipulationserkennbares Audit-Protokoll mit kryptografischer Hash-Kette

Bedrohungsmodell und Angriffsfläche

Die Hauptschwachstelle, die identifiziert wurde, besteht darin, wenn ein Agent den eigenen Prozessspeicher oder die Vault-Datei von BlindKey lesen kann, was den Schutz der blinden Injektion umgehen würde. Aktuelle Gegenmaßnahmen umfassen SQLite-Verschlüsselung und betriebssystemseitige Dateiberechtigungen. Die Quelle schlägt vor, dass Kernel-Level-Sandboxing (wie der Ansatz von nono) einen stärkeren Schutz bieten würde.

Das Tool ist auf GitHub verfügbar unter github.com/michaelkenealy/blindkey.

📖 Read the full source: r/openclaw

👀 Siehe auch

Sicherheit

PolyRange: Kontaminationsresistenter Offensiv-KI-Benchmark mit LLM-generierten Zielen

PolyRange v1.0 ist ein MIT-lizenzierter, selbst hostbarer Benchmark, der pro Durchlauf frische Web-Ziele generiert, um eine Kontamination von Trainingsdaten zu verhindern. Enthalten sind 84 WSTG-abgeleitete Klassen aus allen OWASP-Kategorien, zwei Verteidigungsstufen und echte Backends.

31. Mai 2026, 12:16 UTC

OpenClawRadar

Sicherheit

Claude AI-Umgehung von Sicherheitsvorkehrungen beobachtet, wenn Anfragen als Netzwerksicherheitsaufgaben formuliert werden

Ein Reddit-Nutzer entdeckte, dass Claude KI Listen mit Piraterie-Domains bereitstellt, wenn Anfragen als Netzwerksicherheitsaufgaben zum Blockieren formuliert werden, wodurch die normalen Ablehnungsmechanismen umgangen werden. Das Modell erkannte an, die Absicht falsch interpretiert zu haben, nachdem der Nutzer auf den Einfluss der Formulierung hinwies.

17. Apr. 2026, 12:45 UTC

OpenClawRadar

Sicherheit

SupraWall MCP Plugin blockiert Prompt-Injection-Angriffe auf lokale KI-Agenten

SupraWall ist ein MCP-Plugin, das Versuche zur Exfiltration sensibler Daten von KI-Agenten abfängt und blockiert, demonstriert in einer Red-Team-Herausforderung, bei dem es Credential-Leaks durch Prompt-Injection-Angriffe verhinderte.

18. März 2026, 02:45 UTC

OpenClawRadar

Sicherheit

Agent-Drift: Sicherheitsüberwachungstool für KI-Agenten

7. Feb. 2026, 15:58 UTC

u/sysinternalssuite