ThumbGate setzt Tsinghuas Natural-Language Agent Harness Pattern für KI-Sicherheit um

✍️ OpenClawRadar📅 Veröffentlicht: 5. April 2026🔗 Source
ThumbGate setzt Tsinghuas Natural-Language Agent Harness Pattern für KI-Sicherheit um
Ad

ThumbGate-Implementierung des NLAH-Musters

Das Natural-Language Agent Harness (NLAH)-Muster aus dem Papier der Tsinghua-Universität (arxiv 2603.25723) formalisiert die Behandlung von KI-Agenten-Sicherheitsebenen als eigenständige Objekte mit spezifischen Komponenten. Das Open-Source-Tool ThumbGate implementiert dieses Muster mit konkreten Zuordnungen zu Produktionssystemen.

Komponenten-Zuordnungen

ThumbGate bildet die vier NLAH-Komponenten auf praktische Implementierungen ab:

  • Verträge → Präventionsregeln, die automatisch aus negativem Feedback generiert werden
  • Verifizierungstore → PreToolUse-Hooks, die jeden Tool-Aufruf vor der Ausführung abfangen
  • Dauerhafter Zustand → SQLite+FTS5-Lerndatenbank, die über Sitzungen hinweg bestehen bleibt
  • Adapter → MCP-Serveradapter für Claude Code, Cursor, Codex, Gemini, Amp
Ad

Wichtige Implementierungserkenntnisse

Die Entwickler fanden heraus, dass Prompt-Regeln stillschweigend scheitern (Agenten können sie umgehen), während Verifizierungstore laut scheitern (Agenten erhalten Block-Antworten und müssen sich anpassen). Sie verwenden Thompson Sampling, um unsichere Schweregrade zu handhaben, wobei neue Regeln als Warnungen beginnen und basierend auf Feedback zu harten Blöcken befördert werden.

Die vollständigen Implementierungsdetails und Zuordnungen sind in ihrer ausführlichen Dokumentation verfügbar.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Kostenloses AI-Produkt-Launch-Playbook-Repository für Claude-Benutzer
Werkzeuge

Kostenloses AI-Produkt-Launch-Playbook-Repository für Claude-Benutzer

Ein Entwickler hat ein kostenloses Repository veröffentlicht, das ein strukturiertes AI-Produkt-Launch-Playbook enthält, das für die Zusammenarbeit mit Claude konzipiert ist. Das Repo organisiert Launch-Erfahrungen in praktische Phasen, einschließlich Strategie, Vorbereitung, Ausführung, und enthält Vorlagen und Werkzeugreferenzen.

OpenClawRadar
AutoAgents Rust-Framework fügt Python-Bindings für Prototyping hinzu
Werkzeuge

AutoAgents Rust-Framework fügt Python-Bindings für Prototyping hinzu

AutoAgents, ein auf Rust basierendes Multi-Agenten-Framework, verfügt nun über Python-Bindings, die es Entwicklern ermöglichen, in Python zu prototypisieren, während die gleiche Rust-Kernlaufzeit, Provider-Schnittstellen, Pipeline-Modell und Agenten-Semantik beibehalten werden. Die Bindings ermöglichen Experimente mit lokalen KI-Modellen ohne externe Systeme.

OpenClawRadar
Benutzer berichten von gemischtem Wert aus OpenClaw und ClawDBot: Was Sie wissen müssen.
Werkzeuge

Benutzer berichten von gemischtem Wert aus OpenClaw und ClawDBot: Was Sie wissen müssen.

OpenClaw und ClawDBot sind vielversprechende KI-Tools zur Automatisierung von Code, haben jedoch einige Nutzer enttäuscht. Dieser Artikel untersucht wichtige Erkenntnisse aus einer Reddit-Diskussion über Nutzererfahrungen und den Wert, den diese Plattformen bieten.

OpenClawRadar
Echtzeit-Aktienanalyse zu Claude Desktop über MCP-Server hinzugefügt
Werkzeuge

Echtzeit-Aktienanalyse zu Claude Desktop über MCP-Server hinzugefügt

Ein Entwickler hat einen MCP-Server namens agent-toolbelt erstellt, der Echtzeit-Aktienanalyse-Fähigkeiten zu Claude Desktop und Claude Code hinzufügt. Das Tool bietet fünf spezifische Analysefunktionen und funktioniert mit einer Ein-Kommando-Installation.

OpenClawRadar