ThumbGate met en œuvre le modèle de harnais d'agent en langage naturel de Tsinghua pour la sécurité de l'IA

✍️ OpenClawRadar📅 Publié: April 5, 2026🔗 Source

Implémentation de ThumbGate du schéma NLAH

Le schéma Natural-Language Agent Harness (NLAH) du document de Tsinghua (arxiv 2603.25723) formalise le traitement des couches de sécurité des agents d'IA comme des objets de première classe avec des composants spécifiques. L'outil open-source ThumbGate implémente ce schéma avec des associations concrètes aux systèmes de production.

Associations des composants

ThumbGate associe les quatre composants NLAH à des implémentations pratiques :

Contrats → Règles de prévention générées automatiquement à partir des retours négatifs
Portes de vérification → Crochets PreToolUse qui interceptent chaque appel d'outil avant exécution
État durable → Base de données de leçons SQLite+FTS5 qui persiste entre les sessions
Adaptateurs → Adaptateurs de serveur MCP pour Claude Code, Cursor, Codex, Gemini, Amp

Principales observations d'implémentation

Les développeurs ont constaté que les règles d'invite échouent silencieusement (les agents peuvent raisonner autour d'elles), tandis que les portes de vérification échouent bruyamment (les agents reçoivent des réponses de blocage et doivent s'adapter). Ils utilisent l'échantillonnage de Thompson pour gérer les niveaux de gravité incertains, où les nouvelles règles commencent comme des avertissements et sont promues en blocages durs en fonction des retours.

Les détails complets d'implémentation et d'association sont disponibles dans leur documentation approfondie.

📖 Read the full source: r/LocalLLaMA

👀 See Also

Tools

Acheminer le trafic de l'API Claude pour contrôler les coûts suite au changement d'abonnement Max

L'abonnement Max d'Anthropic ne couvre plus l'utilisation d'outils tiers, forçant les utilisateurs d'OpenClaw à passer à la facturation par API. Un proxy de routage dirige les tâches simples vers Claude Sonnet (3 $/M d'entrée, 15 $/M de sortie) et les tâches complexes vers Opus (5 $/M d'entrée, 25 $/M de sortie), réduisant les coûts sans perte de qualité.

Apr 13, 2026, 08:45 PM UTC

OpenClawRadar

Tools

Envoyer les agents OpenClaw comme participants à une réunion avec voix, chat et partage d'écran

Une nouvelle compétence permet aux agents OpenClaw de participer à Google Meet, Teams et Zoom avec voix (STT/TTS), chat, avatar vidéo et partage d'écran.

May 24, 2026, 12:18 AM UTC

OpenClawRadar

Tools

AIMEAT : Un protocole auto-hébergé pour les agents IA, les LLM locaux et les capacités partagées

AIMEAT est un protocole et serveur auto-hébergé qui permet aux humains, aux agents IA et aux LLM locaux de partager des applications, des connaissances et des capacités via HTTP/JSON. Pas de verrouillage propriétaire, pas de SDK spécial — de simples requêtes et des récupérations d'URL.

May 5, 2026, 04:22 PM UTC

OpenClawRadar

Tools

OpenClaw Browser Relay Extension Chrome Alternative aux Configurations Manuelles

Un utilisateur de Reddit rapporte un succès avec une extension Chrome pour le relais de navigateur OpenClaw après que des tentatives de configuration manuelle aient provoqué des plantages du système et des maux de tête de débogage.

Apr 18, 2026, 02:45 AM UTC

OpenClawRadar