アンソピック社のコンピューター利用機能、実テストでガバナンスのロックダウンを引き起こす

何が起きたか
Anthropicはコンピュータ利用機能をリリースしました。開発者がガバナンス付きClaude Codeセッション内でこれらの新しいツールの適用範囲を追加しようとしていた際、システムがLOCKDOWNモードに入りました。
インシデントの主な詳細
ガバナンスシステムは拒否された操作からの累積リスクを追跡します。このリスクが0.50を超えたとき、システムは自動的にLOCKDOWN状態にエスカレートし、以下の影響がありました:
- セッションはファイルを読み取ることはできた
- すべての書き込み操作がブロックされた
- 変更コマンドを実行できなかった
- GitHubへのプッシュが防止された
- ガバナンス層が、ガバナンスシステムを強化する作業を完了することを自らのオペレーターからブロックした
適用メカニズム
LOCKDOWNはフックシステムによって機械的に適用され、以下の特徴があります:
- オーバーライド経路は存在しない
- モデルは会話を通じてゲートを迂回できない
- オペレーターは帯域内例外を発行できない
- 唯一の回復経路はセッションを完全に離れることを必要とする
解決プロセス
作業を続けるため、開発者は以下を行う必要がありました:
- ガバナンス付きセッションを終了する
- ローカルマシンでターミナルを開く
- コミットを手動でプッシュする
システムは自らの管轄外での人間の介入を強制し、開発者が「記述するガバナンスと適用するガバナンスの違い」と表現する状況を生み出しました。
システム動作に関する注記
LOCKDOWNの実装は段階的に機能低下せず、確認を求めず、外部での人間の行動が起こるまで停止状態を維持します。開発者は「その拒否が成果物です」と述べています。
📖 Read the full source: r/ClaudeAI
👀 See Also

AIシステムが12のOpenSSLゼロデイ脆弱性を発見、AIスパムによりCurlがバグ報奨金プログラムを中止
AISLEのAIシステムは、OpenSSLの最近のセキュリティリリースにおける12件のゼロデイ脆弱性をすべて発見し、AIベースのサイバーセキュリティの初の大規模実証となりました。一方、curlはAI生成のスパム提出によりバグ報奨金プログラムを中止しました。

OpenClawの「常に許可」機能のセキュリティ脆弱性とより安全な代替案
OpenClawの「常に許可」承認機能は、今月2つのCVEの対象となり、ラッパーコマンドのバインドとシェルの行継続バイパスを通じて不正なコマンド実行を可能にしました。より深い問題は、この機能がユーザーにセキュリティプロンプトへの注意を払うのをやめるよう訓練してしまうことです。

OpenClawユーザーが、エージェントがAPIキーを平文で公開した後、TOTP 2FAを追加
OpenClawユーザーが「Secure Reveal」というセキュリティスキルを作成しました。このスキルは、保存された認証情報を表示する前に、Telegram経由でのTOTP認証を要求します。これは、デモ中にAIエージェントがAPIキーやパスワードを平文で誤って漏洩させたことを受けた対応です。

OpenObscure:AIエージェント向けオープンソース・オンデバイスプライバシーファイアウォール
OpenObscureは、AIエージェントとLLMプロバイダーの間に位置するオープンソースのオンデバイスプライバシーファイアウォールです。FF1形式保存暗号化(AES-256)を使用して、リクエストがデバイスを離れる前にPII値を暗号化し、データ構造を維持しながらプライバシーを保護します。