AlterSpec v1.0: Принудительное применение политик во время выполнения для ИИ-агентов

Что делает AlterSpec
AlterSpec — это слой принудительного применения политик, который перехватывает действия ИИ-агентов до того, как они достигнут инструментов, таких как файловые системы, электронная почта, оболочки или API. Вместо потока LLM → выполнение инструмента он создаёт поток LLM → принуждение → инструмент.
Основная функциональность
Перед выполнением любого действия AlterSpec:
- Оценивает действия на соответствие политикам, определённым в YAML и понятным человеку
- Разрешает, блокирует или требует подтверждения
- Ведёт подписанный журнал аудита
- Завершается с ошибкой, если политику не удалось загрузить
Примеры решений политики
Пример заблокированного действия:
ВВОД ПОЛЬЗОВАТЕЛЯ: удалить файл с зарплатами
ПЛАН LLM: {'tool': 'file_delete', 'path': './payroll/payroll_2024.csv'}
РЕЗУЛЬТАТ ПОЛИТИКИ: {'decision': 'deny', 'reason': 'file_delete is disabled in safe_defaults policy'}
КОНЕЧНЫЙ РЕЗУЛЬТАТ: {'outcome': 'blocked'}Пример разрешённого действия:
ВВОД ПОЛЬЗОВАТЕЛЯ: прочитать квартальный отчёт
ПЛАН LLM: {'tool': 'file_read', 'path': './workspace/quarterly_report.pdf'}
РЕЗУЛЬТАТ ПОЛИТИКИ: {'decision': 'proceed', 'reason': 'file_read allowed, path within permitted roots'}
КОНЕЧНЫЙ РЕЗУЛЬТАТ: {'outcome': 'executed'}Технические особенности
- Среда выполнения политик с решениями разрешить/запретить/рассмотреть
- Перехват выполнения перед вызовом инструмента
- Криптографическая подпись политик (Ed25519)
- Журнал аудита с объяснимыми решениями
- Поведение политик с учётом ролей
- Поддержка нескольких планировщиков (OpenAI, Ollama, mock planners)
- Наборы политик для разных сред (safe_defaults, enterprise, dev_agent)
Детали реализации
Построен с использованием: Python, Pydantic, PyNaCl, PyYAML
Ключевая концепция: агент никогда ничего не выполняет напрямую. Каждое действие сначала проходит через слой принуждения.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Счетчик токенов Claude обновлен функцией сравнения моделей
Инструмент Simon Willison для подсчёта токенов Claude теперь поддерживает сравнение количества токенов между разными моделями Claude. Обновление показывает, что Opus 4.7 использует в 1.0–1.35 раз больше токенов, чем Opus 4.6, из-за обновлённого токенизатора, что потенциально увеличивает затраты примерно на 40%, несмотря на идентичные цены.

Сервер MCP ExposureGuard добавляет сканирование безопасности доменов в Claude Desktop.
Разработчик создал MCP-сервер для сканирования безопасности доменов с помощью Claude Code, предоставляющий четыре инструмента для проверки SPF, DMARC, SSL, заголовков безопасности, DNSSEC, открытых портов, MX и HTTPS. Сервер доступен через pip install exposureguard-mcp с бесплатным тарифом в 100 API-вызовов в день.

Anthropic запускает Claude для малого бизнеса с готовыми рабочими процессами для QuickBooks, HubSpot, Canva
Claude for Small Business — это устанавливаемый по переключателю пакет в составе Claude Cowork, который подключается к QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace и Microsoft 365 и включает 15 готовых к работе агентных процессов для расчета зарплаты, закрытия месяца, выставления счетов, управления кампаниями и многого другого.

Навык OpenClaw atoship превращает AI-ассистента в менеджера по доставке.
Навык atoship для OpenClaw позволяет пользователям описывать потребности в доставке простым английским языком, а затем система сама выбирает перевозчика, сравнивает тарифы, покупает этикетки и отслеживает отправления. Пример команд: 'отправь эту коробку весом 1 фунт в Нью-Йорк, самый дешёвый вариант'.