PromptForest: Lokale-First Eingabeinjektionsdetektion mit Unsicherheit

✍️ OpenClawRadar📅 Veröffentlicht: 14. Februar 2026🔗 Source
PromptForest: Lokale-First Eingabeinjektionsdetektion mit Unsicherheit
Ad

PromptForest ist eine neue lokal zuerst gedachte Bibliothek, die entwickelt wurde, um die häufigen Probleme zu lösen, die bei aktuellen Erkennungsmodellen für Eingabeaufforderungsinjektionen auftreten. Sie zielt darauf ab, Eingabeaufforderungsinjektionen und Jailbreaks effizient und mit einem Maß an Unsicherheit zu erkennen, um übertriebene Zuversicht in die Ergebnisse zu vermeiden. Dieser Ansatz unterscheidet sie von traditionellen Systemen, insbesondere indem sie die Leistung aufrecht erhält und gleichzeitig differenziertere Ausgaben bietet.

Ad

Wichtige Details

Eines der grundlegenden Probleme mit bestehenden Injektionsdetektoren ist die Abhängigkeit von großen Modellen wie Llama 2 8B und Qualifire Sentinel 0.6B. Diese Modelle sind nicht nur langsam, sondern ihre Überzuversicht in die Ergebnisse kann zu falsch positiven Ergebnissen führen, die ihr Vertrauen in Produktionsszenarien untergraben. Angesichts dieser Einschränkungen nutzt PromptForest eine Abstimmungsmethode mit einem Ensemble, das aus drei kleineren, spezialisierten Modellen besteht:

  • Llama Prompt Guard (86M): Bietet den höchsten erwarteten Kalibrierungsfehler (ECE) in seiner Gewichtsklasse vor dem Ensemble.
  • Vijil Dome (ModernBERT): Liefert die höchste Genauigkeit pro Parameter.
  • Custom XGBoost: Trainiert auf Einbettungen für architektonische Diversität.

Diese Modelle verwenden gemeinsam eine gewichtete Soft-Voting-Methode, um Ergebnisse zu bestimmen, bei der genauere Modelle einen größeren Einfluss haben. Diese Methode vereinfacht die Entscheidungsfindung und gewährleistet gleichzeitig hohe Genauigkeit und Konsistenz.

Benchmark-Tests zeigen, dass PromptForest mit einer durchschnittlichen Latenz von ~141 ms arbeitet, im Vergleich zu ~225 ms für den Qualifire Sentinel v2, während eine vergleichbare Genauigkeit von 90 % gegenüber deren 97 % erzielt wird. Die Kalibrierungs-ECE schneidet ebenfalls gut ab mit 0.070 im Vergleich zu Sentinels 0.096. Auch die Durchsatzrate ist beeindruckend, mit etwa 27 verarbeiteten Eingabeaufforderungen pro Sekunde auf einer Verbrauchergrafikkarte mit dem pfranger CLI.

Für Tests und Implementierungen können Entwickler mit PromptForest auf Google Colab experimentieren oder Eingabeaufforderungen mit dem PFRanger-Tool auditieren, das vollständig lokal funktioniert. PFRanger nutzt Parallelisierung, um Geschwindigkeit und Durchsatz zu erhöhen.

📖 Den vollständigen Artikel lesen: r/LocalLLaMA

Ad

👀 Siehe auch

OpenClaw-Mem0-Plugin fügt persistenten Speicher außerhalb des Kontextfensters hinzu
Werkzeuge

OpenClaw-Mem0-Plugin fügt persistenten Speicher außerhalb des Kontextfensters hinzu

Das openclaw-mem0-Plugin verlagert die Speicherung von Erinnerungen vollständig außerhalb des Kontextfensters von OpenClaw und verhindert so Verluste durch Komprimierung oder Sitzungsneustarts. Es bietet automatisches Abrufen und Erfassen mit Optionen für Cloud- und lokale Einrichtung.

OpenClawRadar
AGI in md: 11 kognitive Komprimierungsstufen für Claude-Systemprompts
Werkzeuge

AGI in md: 11 kognitive Komprimierungsstufen für Claude-Systemprompts

Ein GitHub-Repository dokumentiert 11 Stufen kognitiver Kompression, die in Claude-Systemprompts kodiert werden können, wobei Stufe 8 von der Analyse zur Konstruktion wechselt und Haikus Leistung von 0/3 auf 4/4 verbessert. Das Projekt umfasst 28 Prompts, 299 Rohausgaben und vollständige Experimentprotokolle über 19 Domänen hinweg.

OpenClawRadar
Orchino: Lokales Multi-Agenten-Orchestrierungssystem für Windows mit paralleler Browser- und UI-Automatisierung
Werkzeuge

Orchino: Lokales Multi-Agenten-Orchestrierungssystem für Windows mit paralleler Browser- und UI-Automatisierung

Orchino ist ein lokales Multi-Agenten-Orchestrierungssystem für Windows, das parallele Browser- und Windows-Aufgaben ausführt, ohne die Benutzeroberfläche zu übernehmen. Eine Demo zeigt, wie 4 Agenten die Aufgabe 'Sony-Kopfhörer auf Flipkart und Amazon suchen, Ergebnisse per E-Mail senden, in Notepad speichern' in 29,5 Sekunden mittels echter Parallelausführung erledigen.

OpenClawRadar
dead-letter: Lokaler .eml-zu-.md-Konverter mit CLI, Web-UI und MCP-Server
Werkzeuge

dead-letter: Lokaler .eml-zu-.md-Konverter mit CLI, Web-UI und MCP-Server

dead-letter normalisiert E-Mail-Exporte in Markdown mit YAML-Frontmatter, anpassbar. Es bietet vier Zugriffsmodi: CLI, Python-Bibliothek, Web-UI und einen MCP-Server zur direkten Integration mit Claude Desktop, Claude Code und Codex.

OpenClawRadar