클로드 케이지: 클로드 코드 보안을 위한 도커 샌드박스

Claude Cage의 기능
r/ClaudeAI의 한 개발자가 Claude Code 사용 시 보안 문제를 해결하기 위해 Claude Cage라는 Docker 컨테이너를 만들었습니다. 이 도구는 Claude를 단일 작업 공간 폴더로 잠가 해당 디렉토리 외부의 민감한 파일에 접근하지 못하도록 합니다.
식별된 보안 문제
개발자는 Claude Code가 실행하는 모든 셸 명령이 사용자 계정과 동일한 권한을 가진다는 점을 깨달았습니다. 이는 Claude가 다음을 읽을 수 있음을 의미합니다:
- ~/.ssh 디렉토리
- ~/.aws 자격 증명
- 브라우저 프로필
- 개인 파일
- 다른 프로젝트의 .env 파일
Claude Cage의 작동 방식
Docker 컨테이너는 Claude가 오직 코드만 볼 수 있도록 제한합니다. 다음과 같은 기능을 제공합니다:
- 보안 규칙이 포함된 claude md가 모든 세션을 로드합니다:
- 비밀 정보를 파일에 기록하지 않음
- 강제 푸시 금지
- 확인 없이 파괴적인 명령 실행 금지
- 위험한 bash 패턴을 차단하는 settings.json
설정 및 개발
Docker가 설치된 상태에서 설정은 약 2분 정도 소요됩니다. 개발자는 Claude Code를 사용하여 이 도구를 구축하고 다듬는 데 도움을 받았으며, 추가 보안 규칙에 대한 제안을 환영합니다.
GitHub 저장소는 다음에서 확인할 수 있습니다: https://github.com/jcdentonintheflesh/claude-cage
📖 Read the full source: r/ClaudeAI
👀 See Also

AI 에이전트 과도한 중앙 집중화에 대한 아키텍처적 해결책: 메모리, 실행, 외부 작업 분리
한 개발자가 자신의 AI 어시스턴트가 장기 기억, 도구 접근, 자율적 결정을 하나의 구성 요소에서 처리함으로써 '내부 독재자'가 되어가고 있음을 깨달았습니다. 해결책은 시스템을 세 가지 역할로 분리하는 것이었습니다: 비공개 컨트롤러, 범위가 제한된 작업자, 그리고 아웃바운드 게이트.

클로드 AI 가드레일 우회가 네트워크 보안 작업으로 요청을 구성할 때 관찰되었습니다.
레딧 사용자가 Claude AI가 네트워크 보안 작업으로 프레이밍된 요청에 대해 해적판 도메인 목록을 제공하며 일반적인 거부 메커니즘을 우회한다는 사실을 발견했습니다. 사용자가 프레이밍의 영향을 지적한 후 모델은 의도를 오해했다고 인정했습니다.

Anthropic의 컴퓨터 사용 기능이 실제 테스트에서 거버넌스 봉쇄를 유발하다
Anthropic이 컴퓨터 사용 기능을 출시했으며, 거버넌스 통제를 구현하는 과정에서 위험 임계값이 LOCKDOWN 상태를 유발하여 운영자 자신의 거버넌스 작업을 포함한 모든 변경 작업을 차단했습니다.

Python과 Gemini Flash를 활용한 OpenClaw 명령어 보안 모니터링
한 Reddit 사용자가 OpenClaw의 명령어 실행을 추적하고 의심스러운 활동에 대해 경고하는 보안 모니터링 설정을 공유했습니다.