ThumbGate реализует паттерн управления агентами на естественном языке от Цинхуа для обеспечения безопасности ИИ.

✍️ OpenClawRadar📅 Опубликовано: 5 апреля 2026 г.🔗 Source
ThumbGate реализует паттерн управления агентами на естественном языке от Цинхуа для обеспечения безопасности ИИ.
Ad

Реализация ThumbGate шаблона NLAH

Шаблон Natural-Language Agent Harness (NLAH) из статьи университета Цинхуа (arxiv 2603.25723) формализует подход к уровням безопасности ИИ-агентов как к объектам первого класса с конкретными компонентами. Инструмент с открытым исходным кодом ThumbGate реализует этот шаблон с конкретными сопоставлениями для производственных систем.

Сопоставление компонентов

ThumbGate сопоставляет четыре компонента NLAH с практическими реализациями:

  • Контракты → Правила предотвращения, автоматически генерируемые из негативных отзывов
  • Шлюзы проверки → Хуки PreToolUse, которые перехватывают каждый вызов инструмента перед выполнением
  • Устойчивое состояние → База данных уроков SQLite+FTS5, сохраняющаяся между сессиями
  • Адаптеры → Адаптеры сервера MCP для Claude Code, Cursor, Codex, Gemini, Amp
Ad

Ключевые инсайты реализации

Разработчики обнаружили, что правила в промптах терпят неудачу молча (агенты могут обходить их с помощью рассуждений), тогда как шлюзы проверки терпят неудачу громко (агенты получают ответы о блокировке и должны адаптироваться). Они используют метод Томпсона для обработки неопределенных уровней серьёзности, где новые правила начинаются как предупреждения и повышаются до жёстких блокировок на основе обратной связи.

Полные детали реализации и сопоставления доступны в их подробной документации.

📖 Прочитать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

OpenClaw против Hermes: выбираем правильного самохостинг-ИИ-агента после 100+ развертываний
Инструменты

OpenClaw против Hermes: выбираем правильного самохостинг-ИИ-агента после 100+ развертываний

Развернув более 100 AI-агентов для клиентов, пользователь Reddit делится выстраданными уроками: OpenClaw (149K звезд) — надежная рабочая лошадка для одиночных/небольших групп; Hermes отлично подходит для оркестрации множества агентов, но имеет меньшее сообщество.

OpenClawRadar
Представляем cltree: текстовый интерфейс для файлового дерева для Claude Code
Инструменты

Представляем cltree: текстовый интерфейс для файлового дерева для Claude Code

<strong>cltree</strong> — это TUI с разделённой панелью, который в реальном времени отображает файловое дерево вашего проекта рядом с Claude Code, показывая текущую рабочую директорию, скрывая лишние файлы и позволяя всем нажатиям клавиш проходить без помех.

OpenClawRadar
Qure: Десктопное приложение для генерации E2E-тестов на основе записанных действий в браузере
Инструменты

Qure: Десктопное приложение для генерации E2E-тестов на основе записанных действий в браузере

Qure — это десктопное приложение от JetBrains (в настоящее время в закрытой бета-версии), которое генерирует сквозной код веб-тестов на основе записей, сделанных во встроенном браузере. Вместо того чтобы описывать сценарии тестирования текстом для ИИ-агентов, разработчики записывают свои ручные QA-сценарии, взаимодействуя с продуктом, а ИИ создаёт рабочий тестовый код, соответствующий их существующей кодовой базе.

OpenClawRadar
Переписанные навыки программирования Карпати для бесплатного плана открывают дисциплину кодирования Claude без Pro
Инструменты

Переписанные навыки программирования Карпати для бесплатного плана открывают дисциплину кодирования Claude без Pro

Пользователь Reddit адаптировал руководство по дисциплине кодирования Карпати для бесплатного плана Claude, удалив зависимости от терминала и подагентов. Системный промпт автоматически срабатывает на запросы кода и стимулирует мышление, ориентированное на проверку.

OpenClawRadar