ThumbGate implementa el patrón de agente de lenguaje natural de Tsinghua para la seguridad de la IA.

✍️ OpenClawRadar📅 Publicado: 5 de abril de 2026🔗 Source

Implementación ThumbGate del Patrón NLAH

El patrón Natural-Language Agent Harness (NLAH) del artículo de Tsinghua (arxiv 2603.25723) formaliza el tratamiento de las capas de seguridad de agentes de IA como objetos de primera clase con componentes específicos. La herramienta de código abierto ThumbGate implementa este patrón con mapeos concretos a sistemas de producción.

Mapeo de Componentes

ThumbGate mapea los cuatro componentes NLAH a implementaciones prácticas:

Contratos → Reglas de prevención generadas automáticamente a partir de retroalimentación negativa
Puertas de Verificación → Ganchos PreToolUse que interceptan cada llamada a herramienta antes de la ejecución
Estado Duradero → Base de datos de lecciones SQLite+FTS5 que persiste entre sesiones
Adaptadores → Adaptadores de servidor MCP para Claude Code, Cursor, Codex, Gemini, Amp

Perspectivas Clave de Implementación

Los desarrolladores descubrieron que las reglas de prompt fallan silenciosamente (los agentes pueden razonar alrededor de ellas), mientras que las puertas de verificación fallan ruidosamente (los agentes reciben respuestas de bloqueo y deben adaptarse). Utilizan Muestreo de Thompson para manejar niveles de severidad inciertos, donde las nuevas reglas comienzan como advertencias y se promueven a bloqueos duros basados en retroalimentación.

Los detalles completos de implementación y mapeo están disponibles en su documentación profunda.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Herramientas

Punto de Referencia de Revisión de Código con IA: Comparación de Claude, Gemini, Codex, Qwen y MiniMax

Un benchmark evaluó cinco modelos de IA en 15 solicitudes de extracción de Milvus con errores conocidos. Claude detectó el 53% de los errores en modo crudo, mientras que el debate adversario entre modelos aumentó la detección al 80%.

27 feb 2026, 09:45 UTC

OpenClawRadar

Herramientas

Herramienta RAG Local Construida con Nemotron Nano 9B v2 y Llamadas de Herramienta vLLM

Un desarrollador creó una herramienta de investigación RAG local-first que funciona completamente en una sola GPU utilizando Nemotron Nano 9B v2 Japanese en vLLM con complementos de análisis personalizados para llamadas a herramientas. El sistema presenta un flujo de extracción-ejecución en dos pasos con extracción de palabras clave bilingüe y búsqueda paralela FTS5/DuckDuckGo.

27 mar 2026, 05:45 UTC

OpenClawRadar

$Infracost reduce el uso de tokens de Claude en un 79% al rediseñar la CLI para agentes de IA$

Herramientas

Infracost reduce el uso de tokens de Claude en un 79% al rediseñar la CLI para agentes de IA

Infracost rediseñó su CLI para agentes de IA, reduciendo los tokens de salida de Claude en un 79% y el costo de API en un 67% en comparación con una línea base de Claude solo. Movimientos clave: pushdown de predicados en la CLI y un formato de salida eficiente en tokens.

19 may 2026, 18:16 UTC

OpenClawRadar

🦀

Herramientas

Agentalmanac: Un catálogo de 23 servidores MCP con configuraciones JSON listas para copiar

Un usuario de Reddit cataloga 23 servidores MCP con configuraciones listas para pegar en Claude Desktop, Cursor y Continue. Redirige servidores archivados a alternativas mantenidas. La demo alojada se ejecuta en Cloudflare Workers.

12 may 2026, 20:18 UTC

OpenClawRadar