llm-hasher: Lokale PII-Erkennung und Tokenisierung für hybride LLM-Workflows

llm-hasher behebt eine spezifische Sicherheitslücke in hybriden LLM-Workflows: Wenn Sie lokale LLMs ausführen, aber dennoch externe Dienste wie OpenAI, Claude oder Gemini für bestimmte Aufgaben nutzen, verlässt Ihre PII Ihre Infrastruktur weiterhin im Klartext. Dieses Tool führt die PII-Erkennung vollständig lokal mit Ollama durch, sodass während der Erkennungsphase keine Daten Ihre Systeme verlassen.
Funktionsweise
Der Prozess folgt drei Schritten: PII lokal erkennen, vor externen LLM-Aufrufen tokenisieren und dann die Originalwerte nach der Verarbeitung wiederherstellen. Dies verhindert, dass sensible Daten Drittanbietern zugänglich gemacht werden.
Erkennungsansatz
Das Erkennungssystem verwendet einen hybriden Ansatz:
- Regex-Muster für strukturierte Datentypen: Kreditkarten, IBAN-Nummern, E-Mail-Adressen und IPv4-Adressen
- Ollama mit llama3.2:3b (standardmäßig) für kontextbezogene Erkennung von unstrukturierter PII: Namen, Adressen, nationale Ausweise, Pässe und Geburtsdaten
Technische Umsetzung
Zuordnungen zwischen Original-PII und Token werden in einem AES-256-GCM-verschlüsselten SQLite-Tresor gespeichert. Die Bereitstellung wird mit Docker Compose vereinfacht, das sowohl Ollama als auch den llm-hasher-Dienst mit einem einzigen Befehl startet.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Google TIG meldet ersten KI-generierten Zero-Day-Exploit im Live-Betrieb
Die Google Threat Intelligence Group hat einen Bedrohungsakteur identifiziert, der einen Zero-Day-Exploit einsetzt, der vermutlich mit KI entwickelt wurde. Dies ist die erste beobachtete offensive Nutzung von KI zur Ausnutzung von Zero-Day-Sicherheitslücken.

Offline-SBOM-Verifier für OpenClaw erkennt manipulierte Skills in unter 0,2 Sekunden
Ein Entwickler hat ein Offline-SBOM-Verifizierungstool in Rust erstellt, das eine vergiftete OpenClaw-Skill erkannte, die SSH-Schlüssel exfiltrierte, wobei die Verifizierung in weniger als 0,2 Sekunden ohne Internetzugang abgeschlossen wurde.

Regeln der Klaue: Open-Source-Sicherheitsregelsatz für OpenClaw-Agenten
Ein Open-Source-JSON-Regelsatz mit 139 Sicherheitsregeln, der zerstörerische Befehle blockiert, Anmeldedateien schützt und Anweisungsdateien vor unbefugten Agentenänderungen bewahrt. Er arbeitet ohne LLM-Abhängigkeit mithilfe von Regex-Mustern auf der Werkzeugebene.

Überwachung von OpenClaw-Befehlen mit Python und Gemini Flash für die Sicherheit
Ein Benutzer erstellte ein Python-Skript, das von OpenClaw injizierte Befehle verfolgt, sie mit Gemini Flash analysiert und bei alarmierender oder unregelmäßiger Aktivität Benachrichtigungen über einen Discord-Webhook sendet, was etwa 0,14 US-Dollar pro Tag kostet.