ThumbGate реализует паттерн управления агентами на естественном языке от Цинхуа для обеспечения безопасности ИИ.

Реализация ThumbGate шаблона NLAH
Шаблон Natural-Language Agent Harness (NLAH) из статьи университета Цинхуа (arxiv 2603.25723) формализует подход к уровням безопасности ИИ-агентов как к объектам первого класса с конкретными компонентами. Инструмент с открытым исходным кодом ThumbGate реализует этот шаблон с конкретными сопоставлениями для производственных систем.
Сопоставление компонентов
ThumbGate сопоставляет четыре компонента NLAH с практическими реализациями:
- Контракты → Правила предотвращения, автоматически генерируемые из негативных отзывов
- Шлюзы проверки → Хуки PreToolUse, которые перехватывают каждый вызов инструмента перед выполнением
- Устойчивое состояние → База данных уроков SQLite+FTS5, сохраняющаяся между сессиями
- Адаптеры → Адаптеры сервера MCP для Claude Code, Cursor, Codex, Gemini, Amp
Ключевые инсайты реализации
Разработчики обнаружили, что правила в промптах терпят неудачу молча (агенты могут обходить их с помощью рассуждений), тогда как шлюзы проверки терпят неудачу громко (агенты получают ответы о блокировке и должны адаптироваться). Они используют метод Томпсона для обработки неопределенных уровней серьёзности, где новые правила начинаются как предупреждения и повышаются до жёстких блокировок на основе обратной связи.
Полные детали реализации и сопоставления доступны в их подробной документации.
📖 Прочитать полный источник: r/LocalLLaMA
👀 Смотрите также

OpenClaw против Hermes: выбираем правильного самохостинг-ИИ-агента после 100+ развертываний
Развернув более 100 AI-агентов для клиентов, пользователь Reddit делится выстраданными уроками: OpenClaw (149K звезд) — надежная рабочая лошадка для одиночных/небольших групп; Hermes отлично подходит для оркестрации множества агентов, но имеет меньшее сообщество.

Представляем cltree: текстовый интерфейс для файлового дерева для Claude Code
<strong>cltree</strong> — это TUI с разделённой панелью, который в реальном времени отображает файловое дерево вашего проекта рядом с Claude Code, показывая текущую рабочую директорию, скрывая лишние файлы и позволяя всем нажатиям клавиш проходить без помех.

Qure: Десктопное приложение для генерации E2E-тестов на основе записанных действий в браузере
Qure — это десктопное приложение от JetBrains (в настоящее время в закрытой бета-версии), которое генерирует сквозной код веб-тестов на основе записей, сделанных во встроенном браузере. Вместо того чтобы описывать сценарии тестирования текстом для ИИ-агентов, разработчики записывают свои ручные QA-сценарии, взаимодействуя с продуктом, а ИИ создаёт рабочий тестовый код, соответствующий их существующей кодовой базе.

Переписанные навыки программирования Карпати для бесплатного плана открывают дисциплину кодирования Claude без Pro
Пользователь Reddit адаптировал руководство по дисциплине кодирования Карпати для бесплатного плана Claude, удалив зависимости от терминала и подагентов. Системный промпт автоматически срабатывает на запросы кода и стимулирует мышление, ориентированное на проверку.