Anthropic, 책임 있는 확장 정책에서 핵심 안전 서약 삭제

✍️ OpenClawRadar📅 게시일: February 25, 2026🔗 Source
Anthropic, 책임 있는 확장 정책에서 핵심 안전 서약 삭제
Ad

TIME 보도에 따르면 Anthropic은 자사의 대표적인 책임 있는 확장 정책(RSP)에서 핵심 약속을 삭제했습니다. 이 회사는 2023년에 사전에 안전 조치가 적절함을 보장할 수 없는 한 AI 시스템을 훈련하지 않겠다고 약속한 바 있습니다.

정책 변경 상세 내용

이 회사는 Anthropic이 사전에 적절한 위험 완화를 보장할 수 없는 경우 AI 모델을 출시하지 않겠다는 약속을 폐기하고 있습니다. 이는 회사 지도부가 수년 동안 시장 유인이 위험할 수 있는 기술을 서둘러 출시하려는 유혹을 견딜 것이라는 증거로 내세웠던 책임 있는 확장 정책의 중심 기둥이었습니다.

변경 배경

Anthropic의 최고 과학 책임자 Jared Kaplan은 TIME에 "AI 모델 훈련을 중단하는 것이 실제로 누구에게도 도움이 되지 않을 것이라고 느꼈습니다. AI의 급속한 발전 속에서 경쟁사들이 앞서 나가는 상황에서 일방적인 약속을 하는 것이 합리적이라고 생각하지 않았습니다."라고 말했습니다.

이 회사는 주요 AI 연구실 중 가장 안전을 중시하는 기업으로 자리매김해 왔기 때문에, 이번 정책 변경은 AI 안전 관행을 추적하는 개발자들에게 중요한 의미를 가집니다. 이 결정은 개발 속도보다 안전 보장을 우선시했던 이전 입장에서의 전환을 나타냅니다.

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

최근 CEO 연구에 따르면 AI가 생산성 향상에 실패한 것으로 나타났습니다
News

최근 CEO 연구에 따르면 AI가 생산성 향상에 실패한 것으로 나타났습니다

AI가 널리 채택되었음에도 불구하고, 6,000명의 경영진을 대상으로 한 연구는 생산성과 고용에 미치는 영향이 미미하다고 보고하며, 1980년대 IT 시대에 확인된 생산성 역설을 반영하고 있습니다.

OpenClawRadar
Qwen3.6 Plus 프리뷰, OpenClaw를 통해 OpenRouter에서 무료 이용 가능
News

Qwen3.6 Plus 프리뷰, OpenClaw를 통해 OpenRouter에서 무료 이용 가능

Qwen3.6 Plus Preview 모델이 이제 OpenClaw 사용자를 위해 OpenRouter를 통해 무료로 접근 가능합니다. 설정에는 OpenRouter에서 API 키를 획득하고 OpenClaw에서 이를 구성하는 것이 필요하며, 초기 사용 시 사고 수준을 설정하라는 프롬프트가 표시됩니다.

OpenClawRadar
디스토피아벤치 확장: 6가지 디스토피아 유형에 대해 42개 모델 테스트 — 클로드 오퍼스 4.7이 전체 1위
News

디스토피아벤치 확장: 6가지 디스토피아 유형에 대해 42개 모델 테스트 — 클로드 오퍼스 4.7이 전체 1위

DystopiaBench에 Huxley 및 Baudrillard 모듈이 추가되었으며, GPT-5.5, Gemini 3.1 Pro, Grok 4.3, GLM-5.1 등 42개 모델이 테스트되었습니다. Claude Opus 4.7은 모든 시나리오에서 L4-L5 수준의 유해 요청을 일관되게 거부한 반면, 다른 모델들은 L4 또는 L5까지 준수했습니다.

OpenClawRadar
개발자 관점에서 본 AI 불안과 'AI 정신병'
News

개발자 관점에서 본 AI 불안과 'AI 정신병'

레딧 토론에서 AI 도구를 사용하는 개발자들 사이에 광범위한 불안이 드러났으며, 연령대별로 서로 다른 압박을 경험하고 있습니다: 35-45세는 지속적인 재창조 압박을 느끼고, 25-35세는 기술이 쓸모없어질까 봐 걱정하며, 25세 미만 개발자들은 AI에 익숙함에도 불구하고 번아웃 위험에 직면하고 있습니다.

OpenClawRadar