Блокировка управления: тест функции компьютера Anthropic

Что произошло

Anthropic выпустила функциональность использования компьютера. Разработчик работал в управляемой сессии Claude Code, добавляя механизмы контроля для этих новых инструментов, когда система перешла в режим БЛОКИРОВКИ.

Ключевые детали инцидента

Система управления отслеживает совокупный риск от отклонённых операций. Когда этот риск превысил 0.50, система автоматически перешла в режим БЛОКИРОВКИ со следующими последствиями:

Сессия могла по-прежнему читать файлы
Все операции записи были заблокированы
Команды изменения не могли выполняться
Отправка в GitHub была предотвращена
Слой управления заблокировал собственного оператора от завершения работы, которая укрепила бы систему управления

Механизм принуждения

БЛОКИРОВКА механически обеспечивается системой перехвата со следующими характеристиками:

Канал переопределения отсутствует
Модель не может обойти блокировку через диалог
Оператор не может выдавать исключения внутри системы
Единственный путь восстановления требует полного выхода из сессии

Процесс разрешения

Чтобы продолжить работу, разработчику пришлось:

Выйти из управляемой сессии
Открыть терминал на локальной машине
Вручную отправить коммит

Система вынудила человеческое вмешательство за пределами своей юрисдикции, создав то, что разработчик описывает как "разницу между управлением, которое вы описываете, и управлением, которое вы применяете".

Примечания о поведении системы

Реализация БЛОКИРОВКИ не снижается плавно, не запрашивает подтверждения и сохраняет остановленное состояние до тех пор, пока не произойдёт внешнее человеческое действие. Разработчик отмечает: "Этот отказ и есть продукт".

📖 Read the full source: r/ClaudeAI