구글, 마이크로소프트, xAI, 초기 AI 모델을 미국 정부와 공유하기로 합의

월스트리트저널이 보도한 새로운 자발적 협약에 따라, 구글, 마이크로소프트, 그리고 xAI(일론 머스크의 AI 기업, Grok 개발사)는 자사 AI 모델의 초기 버전을 미국 정부와 공유하기로 약속했습니다. 이는 공개 배포 전에 연방 안전 평가를 받을 수 있도록 하기 위한 광범위한 노력의 일환입니다.
주요 세부 사항
- 이 협약에는 출시 전 안전성 테스트와 위험 평가를 위해 미국 정부에 AI 모델에 대한 조기 접근권을 제공하는 내용이 포함됩니다.
- 기업들은 법적 의무가 아닌 자발적으로 참여하고 있습니다. 목표는 책임 있는 AI 개발을 위한 프레임워크를 구축하고 잠재적 위험을 조기에 발견하는 것입니다.
- WSJ 기사에서 구체적인 모델 이름은 언급되지 않았지만, 각 회사의 주요 차기 출시작인 구글의 Gemini 업그레이드, 마이크로소프트의 Copilot/OpenAI 통합, xAI의 Grok 반복 버전이 포함될 가능성이 높습니다.
- 이는 2023년 AI 연구소들이 백악관과 체결한 자발적 약속과 유사하지만, 이제는 정부 기관과의 보다 체계적인 공유 협약으로 공식화되었습니다.
AI 코딩 에이전트(예: GitHub Copilot, Claude, 또는 로컬 모델인 Grok)를 사용하는 개발자에게 이는 여러분이 배포하는 모델이 연방 안전 검토를 거쳤을 수 있음을 의미합니다. 또한 향후 더 많은 규제 감독이 있을 수 있으며, API 접근 및 모델 동작 가드레일에 영향을 미칠 수 있습니다. 이러한 평가가 모델 출시 일정과 기능 제한에 어떤 영향을 미치는지 주목하세요.
이 기사에 대한 HN 토론(36포인트, 57댓글)은 여기에서 활발히 진행 중입니다.
📖 전체 소스 읽기: HN AI Agents
👀 See Also

DeepSeek V4 Flash 비용 분석: 캐시 적중률과 가격 비율 설명
DeepSeek V4 Flash는 Opus 4.7 대비 에이전트 태스크당 비용이 0.0066배로, 97%의 캐시 적중률과 0.02의 캐시 읽기-쓰기 가격 비율에 힘입은 결과입니다.

Firefox 148은 AI 킬 스위치와 향상된 개인정보 보호 기능을 추가합니다.
Firefox 148은 사용자가 챗봇 프롬프트와 AI 생성 링크 요약을 포함한 모든 AI 기능을 비활성화할 수 있는 'AI 킬 스위치' 기능을 도입했습니다. 이 업데이트는 원격 업데이트와 데이터 수집에 대한 더 많은 제어권도 제공합니다.

오픈소스 모델이 벤치마크에서 Claude Opus 4.6을 따라잡거나 능가합니다
DeepSeek V3.2, DeepSeek R1, Kimi K2.5, MiniMax M2.5는 MMLU-Pro, 속도, 도구 사용, 추론 등 5개 주요 벤치마크 중 4개에서 Claude Opus 4.6을 능가하면서도 상당히 저렴합니다.

Anthropic, Claude의 컴퓨터 사용 능력 향상을 위해 Vercept AI 인수
Anthropic이 Claude의 컴퓨터 사용 기능을 개발하기 위해 Vercept AI를 인수했습니다. 이 인수는 AI가 복잡한 작업에 더 유용하도록 하기 위해 지각과 상호작용 문제를 해결하는 데 초점을 맞추고 있습니다.