AI의 브로커노믹스: Anthropic의 신화/우화 수출 금지 혼란

Ed Zitron의 AI's Brokenomics는 Anthropic이 '너무 위험하다'고 여겼던 Mythos 모델을 Fable이라는 이름으로 가드레일을 장착해 출시한 후, 연구원들이 며칠 만에 이를 탈옥시키면서 미국 수출 통제를 받게 된 혼란을 다룹니다. 기사를 바탕으로 무슨 일이 일어났는지 설명합니다.
타임라인
- Anthropic은 '너무 강력해서 출시할 수 없다'고 설명된 LLM인 Claude Mythos를 발표했습니다. 6월 2일 15개국 150개 조직에 출시되었습니다.
- 6월 9일, Mythos는 Fable이라는 이름으로 가드레일과 함께 출시되었습니다.
- Amazon 연구원들이 며칠 만에 Fable을 탈옥시키면서, Amazon CEO Andy Jassy와 다른 익명의 회사들이 국가 안보 위험을 이유로 미국 상무부에 신고했습니다.
- 트럼프 행정부는 비미국 시민의 Mythos 및 Fable 접근을 금지하는 수출 통제를 부과했고, Anthropic에 90분 내에 모델을 롤백하도록 명령했습니다.
주요 기술적 세부 사항
- Fable은 생물학 무기와 사이버 보안 주제를 차단하지만, 탈옥이 이러한 가드레일을 우회했습니다.
- Anthropic은 '범용 탈옥'은 발견되지 않았고 특정 우회 방법만 있었다고 주장했습니다. 자사의 안전장치가 너무 강력해서 '많은 사용자들이 지나치게 광범위하다고 불평한다'고 밝혔습니다.
- 익명의 연구원 Pliny The Liberator도 모델의 보안 프로토콜을 무너뜨렸습니다.
- Davi Ottenheimer는 Mythos의 시스템 카드를 분석하며, 이 모델이 단순히 더 큰 LLM으로서 LLM용 테스트에서 더 높은 점수를 받은 것일 뿐, 자기 개선이나 AGI와는 관련이 없다고 주장했습니다.
여파
Anthropic은 화상 회의가 실패한 후, 워싱턴 D.C.에 선임 기술 인력을 파견하여 트럼프 행정부와 협상 중입니다. 수출 통제 명령은 미국 내외의 모든 비미국 시민이 모델에 접근하는 것을 금지하여 사실상 전역에서 모델을 비활성화시켰습니다.
기사는 Anthropic이 수년간 AI 위험을 과장하여 조직이 프리미엄 액세스 비용을 지불하도록 유도했으며, 이번 규제 역풍은 그 전략의 자연스러운 결과라고 시사합니다.
📖 전체 기사 읽기: HN LLM Tools
👀 See Also

Mistral AI가 산업 공학 AI 스택 구축을 위해 Emmi AI를 인수하다
Mistral AI가 Emmi AI를 인수하여 에너지, 자동차, 반도체, 항공우주 분야의 산업 시뮬레이션을 위한 물리학 AI 모델을 통합합니다. 30명 이상의 연구원으로 구성된 통합 팀은 린츠에 새로운 사무소를 개설할 예정입니다.

Claude Security 공개 베타: 코드베이스 스캔, 자체 발견 검증, 패치 제안
Anthropic이 엔터프라이즈 고객을 대상으로 Claude Security를 퍼블릭 베타로 출시했습니다. 보안 연구원처럼 코드를 추론하고, 적대적 자체 검증을 통해 자신의 결과에 이의를 제기하며, 구체적인 패치를 제안합니다.

코덱스 대화: AI 자동화에서 오픈클로의 후계자
코덱스가 이제 자기 자신과 소통할 수 있게 되어 AI 기반 자동화의 새로운 시대를 열었으며, 이전의 선두주자였던 오픈클로를 효과적으로 대체했습니다.
오퍼스 4.7 추론 노력 벤치마크: 실제 작업에서 중간이 높음과 최대를 능가
GraphQL-go-tools 저장소의 29개 태스크에서 Claude Code의 Opus 4.7이 중간 추론 노력 수준에서 최고 성능을 보였습니다. 더 높은 설정은 정확성을 떨어뜨리고 비용을 증가시켰으며 패치 품질은 개선되지 않았습니다.