ThumbGate Implementa o Padrão de Controle de Agente de Linguagem Natural da Tsinghua para Segurança de IA

✍️ OpenClawRadar📅 Publicado: April 5, 2026🔗 Source
ThumbGate Implementa o Padrão de Controle de Agente de Linguagem Natural da Tsinghua para Segurança de IA
Ad

Implementação ThumbGate do Padrão NLAH

O padrão Natural-Language Agent Harness (NLAH) do artigo da Tsinghua (arxiv 2603.25723) formaliza o tratamento de camadas de segurança de agentes de IA como objetos de primeira classe com componentes específicos. A ferramenta de código aberto ThumbGate implementa esse padrão com mapeamentos concretos para sistemas de produção.

Mapeamentos de Componentes

O ThumbGate mapeia os quatro componentes NLAH para implementações práticas:

  • Contratos → Regras de prevenção geradas automaticamente a partir de feedback negativo
  • Portas de Verificação → Ganchos PreToolUse que interceptam cada chamada de ferramenta antes da execução
  • Estado Durável → Banco de dados de lições SQLite+FTS5 que persiste entre sessões
  • Adaptadores → Adaptadores de servidor MCP para Claude Code, Cursor, Codex, Gemini, Amp
Ad

Principais Insights de Implementação

Os desenvolvedores descobriram que regras de prompt falham silenciosamente (agentes podem contorná-las com raciocínio), enquanto portas de verificação falham ruidosamente (agentes recebem respostas de bloqueio e devem se adaptar). Eles usam Thompson Sampling para lidar com níveis de severidade incertos, onde novas regras começam como avisos e são promovidas a bloqueios rígidos com base no feedback.

Os detalhes completos da implementação e mapeamento estão disponíveis em sua documentação detalhada.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

OpenClaw Integra Recursos do Vazamento de Código do Claude
Tools

OpenClaw Integra Recursos do Vazamento de Código do Claude

Um usuário do OpenClaw fez seu bot analisar o código vazado do Claude (recriação em Rust por Instructkr) e portou seletivamente padrões arquiteturais específicos para sua configuração do OpenClaw. A integração foca em melhorias práticas como continuidade automática na inicialização, compactação de conversas e uma estrutura de ganchos pré-ferramenta/pós-ferramenta.

OpenClawRadar
Orquestrador de Agentes Paralelos para Claude Code Usando Git Worktrees
Tools

Orquestrador de Agentes Paralelos para Claude Code Usando Git Worktrees

Um desenvolvedor criou um orquestrador paralelo que usa git worktrees para criar ambientes isolados para agentes Claude Code, resolvendo o problema de diretórios de trabalho compartilhados causando aplicativos quebrados e status git confuso.

OpenClawRadar
AIMEAT: Um Protocolo Auto-Hospedado para Agentes de IA, LLMs Locais e Capacidades Compartilhadas
Tools

AIMEAT: Um Protocolo Auto-Hospedado para Agentes de IA, LLMs Locais e Capacidades Compartilhadas

AIMEAT é um protocolo e servidor auto-hospedado que permite que humanos, agentes de IA e LLMs locais compartilhem aplicativos, conhecimento e capacidades via HTTP/JSON. Sem dependência de fornecedor, sem SDK especial — prompts simples e buscas de URL.

OpenClawRadar
Plugin Claude Code para Pesquisa de Negócios no Reddit
Tools

Plugin Claude Code para Pesquisa de Negócios no Reddit

Um plugin do Claude Code automatiza a pesquisa no Reddit para empresas, buscando postagens relevantes, analisando discussões e gerando relatórios estruturados em markdown com descobertas e links de origem. Sem necessidade de chaves de API — instale via GitHub e execute com um único comando.

OpenClawRadar