Claude Code 2.1.136: Безопасность действий, жесткие правила запрета и монитор безопасности

✍️ OpenClawRadar📅 Опубликовано: 9 мая 2026 г.🔗 Source

Claude Code v2.1.136 вносит значительные изменения в безопасность агентов и соблюдение правил в системном промпте, промпте агента и описаниях инструментов. Вот что нового и как это влияет на поведение автономных агентов.

Системный промпт: Безопасность действий и правдивая отчетность

Обновленный системный промпт теперь требует от агентов запрашивать подтверждение перед выполнением необратимых или внешних действий, если только эти действия не были долгосрочно авторизованы. Агенты должны проверять цели перед их удалением или перезаписью. Требования к отчетности подчеркивают честное раскрытие пропущенных шагов, неудачных тестов и проверенных результатов — никакого приукрашивания неудач.

Промпт агента: Проверка правил в автоматическом режиме

Вводится новая категория пользовательских правил hard_deny как четвертый вариант наряду с существующими allow, deny и soft_deny. hard_deny безусловно блокирует действия на границе безопасности — намерение пользователя не может его переопределить. Существующая категория soft_deny сужена, чтобы охватывать только деструктивные или необратимые действия, которые можно авторизовать явным намерением пользователя.

Промпт агента: Монитор безопасности для действий автономных агентов

Логика монитора безопасности перестроена на две части. Первая часть разделяет блокировку на безусловные жесткие блоки и авторизуемые пользователем мягкие блоки. Правило по умолчанию обновлено, и намерение пользователя больше не может снять жесткие блоки безопасности. Вторая часть переносит эксфильтрацию данных в набор жестких блоков, добавляет покрытие жестких блоков для обхода проверок безопасности и считает любые внешние сервисы или источники загрузки, предполагаемые агентом, ненадежными.

Описание инструмента: Редактирование

Описание инструмента «Редактировать» теперь восстанавливает формат префикса номера строки как переменную шаблона, сохраняя при этом указание, что префиксы строк должны быть исключены из фактических строк редактирования. Это исправление для обеспечения согласованности.

Эти изменения ужесточают требования безопасности для автономных агентов Claude Code. Разработчикам, использующим пользовательские правила, следует обновить свои конфигурации, чтобы использовать hard_deny для критически важных блоков безопасности. Полные диффы промптов доступны в релизе.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

🦀

Новости

Transformer Language Model работает локально на стандартной Game Boy Color

Модель TinyStories-260K Андрея Карпати работает на стандартном Game Boy Color через пользовательскую прошивку, используя INT8 с фиксированной запятой и переключаемую банками память картриджа для весов и KV-кэша.

13 мая 2026 г., 02:18 UTC

OpenClawRadar

Новости

Выпуск OpenClaw 2026.3.11 добавляет локальную настройку Ollama, унифицированные ключи OpenCode и мультимодальную память.

OpenClaw 2026.3.11 представляет первоклассную настройку Ollama с локальным или гибридным режимами, унифицированное управление ключами OpenCode для моделей Zen и Go, а также мультимодальную индексацию изображений и аудио с использованием эмбеддингов Gemini.

14 мар. 2026 г., 05:45 UTC

OpenClawRadar

Новости

Проверка цен на DeepSeek V4: кэшированные токены в 178 раз дешевле Opus, но признано отставание в возможностях

Вход DeepSeek V4 Pro стоит $0.145/М токенов против $5/М у Claude Opus 4.7 (в 34 раза дешевле); попадание в кеш — $0.0036/М против $0.625/М (в 173 раза дешевле). По возможностям он отстает от GPT-5.4 и Gemini 3.1 Pro на 3-6 месяцев.

29 апр. 2026 г., 06:18 UTC

OpenClawRadar

Новости

Анализ: Сравнение индустрии искусственного интеллекта с паттернами кризиса субстандартного ипотечного кредитования

Анализ Эдварда Зитрона проводит параллели между ипотечным кризисом 2008 года и текущими тенденциями в индустрии искусственного интеллекта, ссылаясь на конкретные данные о регулируемых ипотечных кредитах и их сходстве с моделями инвестирования в ИИ.

14 апр. 2026 г., 13:06 UTC

OpenClawRadar