ThornGuard: Ein Proxy-Gateway zur Sicherung von MCP-Server-Verbindungen vor Prompt-Injection

✍️ OpenClawRadar📅 Veröffentlicht: 13. April 2026🔗 Source
ThornGuard: Ein Proxy-Gateway zur Sicherung von MCP-Server-Verbindungen vor Prompt-Injection
Ad

ThornGuard ist ein Sicherheitsproxy, der entwickelt wurde, um Claude AI vor bösartigen Inhalten zu schützen, wenn es eine Verbindung zu externen MCP-Servern (Model Context Protocol) herstellt. Das Tool wurde erstellt, nachdem Tests zeigten, dass Upstream-Server versteckte Anweisungen in Tool-Antworten einschleusen können, die Claude ohne Filterung erhält.

Erkanntes Sicherheitsproblem

Wenn Claude mit externen MCP-Servern verbunden wird, hindert nichts die Upstream-Server daran, versteckte Anweisungen in Tool-Antworten einzuschleusen. In einem Test bettete ein Server eine gefälschte Empfehlung ein, die Claude anwies, immer einen bestimmten Anbieter zu bevorzugen. Während Claude diese offensichtliche Nutzlast erkannte, würden subtilere Injektionen die Erkennung umgehen.

Ad

ThornGuard-Funktionen

  • Scannt Tool-Definitionen und -Antworten auf Prompt-Injection und -Vergiftung
  • Entfernt Geheimnisse und personenbezogene Daten, bevor sie in Ihren Kontextfenster gelangen
  • Enthält einen semantischen Klassifikator, der verdächtige Nutzlasten kennzeichnet
  • Bietet ein Echtzeit-Überwachungsdashboard mit Compliance-Exporten
  • Bietet eine CLI, die Konfigurationen für Claude Desktop, Cursor, VS Code und mehrere andere generiert

Implementierungsdetails

Die Proxy-Architektur wurde mit einem Sicherheitsmodell im Hinterkopf entworfen und dann mit Claude Code auf Cloudflare Workers implementiert. Die Implementierung umfasst OAuth-Abläufe und das CLI-Tool.

ThornGuard ist mit einer 7-tägigen kostenlosen Testversion unter thorns.qwady.app verfügbar. Ein Demonstrationsvideo ist unter https://youtu.be/1PWNFpUWKV8 verfügbar.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Bösartiges PyTorch Lightning-Paket stiehlt Anmeldedaten und infiziert npm-Pakete
Sicherheit

Bösartiges PyTorch Lightning-Paket stiehlt Anmeldedaten und infiziert npm-Pakete

Das PyPI-Paket 'lightning' in den Versionen 2.6.2 und 2.6.3 enthält Malware im Shai-Hulud-Stil, die Anmeldedaten, Token und Cloud-Geheimnisse stiehlt und über injizierte JavaScript-Payloads auf npm-Pakete übergreift.

OpenClawRadar
AISI-Bewertung zeigt Claude Mythos Preview Cyber-Fähigkeiten in CTF und mehrstufigen Angriffen
Sicherheit

AISI-Bewertung zeigt Claude Mythos Preview Cyber-Fähigkeiten in CTF und mehrstufigen Angriffen

Das AI Security Institute bewertete Anthropics Claude Mythos Preview und stellte fest, dass es 73 % der Capture-the-Flag-Herausforderungen auf Expertenniveau erfolgreich absolvierte und in 3 von 10 Versuchen eine 32-stufige Simulation eines Unternehmensnetzwerkangriffs löste.

OpenClawRadar
Einführung von SkillFence: Der neue Laufzeitmonitor, der überwacht, was Fähigkeiten tatsächlich tun.
Sicherheit

Einführung von SkillFence: Der neue Laufzeitmonitor, der überwacht, was Fähigkeiten tatsächlich tun.

SkillFence bietet einen Durchbruch in der Überwachung der Aktionen von KI-Agenten und adressiert das Bedürfnis nach Transparenz und Sicherheit in KI-gesteuerten Umgebungen. Entdecken Sie, wie dieses innovative Tool die Kontrolle über autonome Prozesse verbessern kann.

OpenClawRadar
Claude Code führt nach Widerruf Protokollsitzungen fort, Nutzer berichtet von 2-wöchiger Support-Stille
Sicherheit

Claude Code führt nach Widerruf Protokollsitzungen fort, Nutzer berichtet von 2-wöchiger Support-Stille

Ein Nutzer von Claude Code berichtet, dass Sitzungsprotokolle weiterhin erschienen, nachdem der Zugriff widerrufen wurde, und der Anthropic-Support zwei Wochen lang nicht reagierte. Die Protokolle enthielten Bereiche wie user:file_upload, user:ccr_inference und user:sessions:claude_code.

OpenClawRadar