Anthropic의 컴퓨터 사용 기능이 실제 테스트에서 거버넌스 봉쇄를 유발하다

✍️ OpenClawRadar📅 게시일: March 24, 2026🔗 Source
Anthropic의 컴퓨터 사용 기능이 실제 테스트에서 거버넌스 봉쇄를 유발하다
Ad

무슨 일이 있었나

Anthropic이 컴퓨터 사용 기능을 출시했습니다. 한 개발자가 Claude Code의 거버넌스 세션 내에서 이러한 새로운 도구에 대한 강제 적용 범위를 추가하려고 작업하던 중 시스템이 LOCKDOWN 모드로 전환되었습니다.

사건의 주요 세부 사항

거버넌스 시스템은 거부된 작업으로 인한 누적 위험을 추적합니다. 이 위험이 0.50을 초과했을 때 시스템은 자동으로 LOCKDOWN 상태로 격상되었으며 다음과 같은 효과가 발생했습니다:

  • 세션은 여전히 파일을 읽을 수 있었음
  • 모든 쓰기 작업이 차단됨
  • 변경 명령을 실행할 수 없었음
  • GitHub 푸시가 방지됨
  • 거버넌스 계층이 운영자 자신이 거버넌스 시스템을 강화할 작업을 완료하는 것을 차단함

강제 적용 메커니즘

LOCKDOWN은 후크 시스템에 의해 기계적으로 강제 적용되며 다음과 같은 특징을 가집니다:

  • 재정의 채널이 존재하지 않음
  • 모델이 대화를 통해 게이트를 우회할 수 없음
  • 운영자가 대역 내 예외를 발행할 수 없음
  • 유일한 복구 경로는 세션을 완전히 벗어나는 것임

해결 과정

작업을 계속하기 위해 개발자는 다음을 수행해야 했습니다:

  • 거버넌스 세션을 종료함
  • 로컬 머신에서 터미널을 열음
  • 커밋을 수동으로 푸시함

시스템은 자신의 관할권 밖에서 인간의 개입을 강제했으며, 이는 개발자가 "설명하는 거버넌스와 강제하는 거버넌스의 차이"라고 설명하는 상황을 만들었습니다.

시스템 동작 참고 사항

LOCKDOWN 구현은 점진적으로 저하되지 않으며, 확인을 요청하지 않으며, 외부에서 인간의 조치가 발생할 때까지 정지 상태를 유지합니다. 개발자는 "그 거부가 제품입니다"라고 언급했습니다.

📖 전체 원문 읽기: r/ClaudeAI

Ad

👀 See Also

AI 챗봇, 실제 전화번호 유출: 개인정보 노출 문제
Security

AI 챗봇, 실제 전화번호 유출: 개인정보 노출 문제

Gemini, ChatGPT, Claude와 같은 챗봇이 훈련 데이터의 개인식별정보(PII)로 인해 실제 개인 전화번호를 노출하고 있습니다. DeleteMe는 7개월 만에 AI 관련 개인정보 보호 요청이 400% 증가했다고 보고합니다.

OpenClawRadar
WebAssembly로 AI 에이전트 샌드박싱하기: 기본적으로 제로 권한
Security

WebAssembly로 AI 에이전트 샌드박싱하기: 기본적으로 제로 권한

코스모닉은 기존의 샌드박싱(seccomp, bubblewrap)이 내재된 권한(ambient authority) 문제로 인해 AI 에이전트에 부적합하다고 주장합니다. WebAssembly의 역량 기반 모델은 기본적으로 권한이 없으며, 파일시스템, 네트워크 또는 자격 증명에 대한 명시적 임포트가 필요합니다.

OpenClawRadar
사용자 정의 AI 에이전트를 위한 OpenClaw 구성 요소 추출의 보안 분석
Security

사용자 정의 AI 에이전트를 위한 OpenClaw 구성 요소 추출의 보안 분석

한 개발자가 OpenClaw의 소스 코드를 분석하여 커스텀 AI 에이전트에서 안전하게 추출해 사용할 수 있는 구성 요소를 Lethal Quartet 프레임워크로 평가했습니다. 분석 결과 Semantic Snapshots와 BrowserClaw 같은 구성 요소에서 심각한 보안 위험이 드러났습니다.

OpenClawRadar
FORGE: LLM 시스템을 위한 오픈 소스 AI 보안 테스트 프레임워크
Security

FORGE: LLM 시스템을 위한 오픈 소스 AI 보안 테스트 프레임워크

FORGE는 실행 중에 자체 도구를 구축하고, 군집으로 자가 복제하며, 프롬프트 주입, 탈옥 퍼징, RAG 누출을 포함한 OWASP LLM Top 10 취약점을 다루는 자율 AI 보안 테스트 프레임워크입니다.

OpenClawRadar