클로드 오푸스 4.6과 소넷 4.6이 이제 표준 가격으로 100만 컨텍스트를 제공합니다

지금 이용 가능한 기능
Claude Opus 4.6과 Sonnet 4.6은 이제 Claude 플랫폼에서 표준 가격으로 완전한 100만 컨텍스트 창을 포함합니다. 표준 가격은 전체 창에 적용됩니다 — Opus 4.6은 100만 토큰당 $5/$25, Sonnet 4.6은 $3/$15입니다. 승수는 없습니다: 900K 토큰 요청은 9K 토큰 요청과 동일한 토큰당 요금으로 청구됩니다.
일반 출시와 함께 변경된 주요 사항
- 장문 컨텍스트 프리미엄 없이 전체 컨텍스트 창에 대해 하나의 가격 적용
- 모든 컨텍스트 길이에서 완전한 속도 제한 — 표준 계정 처리량이 전체 창에 적용
- 요청당 6배 더 많은 미디어: 최대 600개의 이미지 또는 PDF 페이지 (기존 100개에서 증가)
- 오늘부터 Claude 플랫폼 기본, Microsoft Azure Foundry, Google Cloud의 Vertex AI에서 이용 가능
- 베타 헤더 불필요 — 20만 토큰 이상의 요청이 자동으로 작동
- 이미 베타 헤더를 보내고 있다면 무시되므로 코드 변경이 필요 없음
Claude Code와의 통합
100만 컨텍스트는 이제 Opus 4.6을 사용하는 Max, Team, Enterprise 사용자를 위한 Claude Code에 포함됩니다. Opus 4.6 세션은 자동으로 전체 100만 컨텍스트 창을 사용할 수 있어, 압축이 줄어들고 대화 내용이 더 많이 유지됩니다.
성능 벤치마크
Opus 4.6은 MRCR v2에서 78.3%의 점수를 기록하며, 해당 컨텍스트 길이에서 최고 수준의 프론티어 모델입니다. Claude Opus 4.6과 Sonnet 4.6은 전체 100만 창에서 정확도를 유지합니다. 장문 컨텍스트 검색은 각 모델 세대마다 개선되었습니다.
개발자를 위한 실질적 의미
이는 전체 코드베이스, 수천 페이지의 계약서, 또는 장기 실행 에이전트의 전체 추적 — 도구 호출, 관찰, 중간 추론 — 을 로드하고 직접 사용할 수 있음을 의미합니다. 이전에 장문 컨텍스트 작업에 필요했던 엔지니어링 작업, 손실 요약, 컨텍스트 정리는 더 이상 필요하지 않습니다.
사용자 피드백에 따르면:
- 소프트웨어 엔지니어들은 컨텍스트를 잃지 않고 하나의 창에서 검색, 재검색, 에지 케이스 집계, 수정 제안을 모두 수행할 수 있다고 보고
- 팀은 압축 이벤트가 15% 감소했으며, 에이전트가 컨텍스트를 유지하고 초기 내용을 잊지 않고 몇 시간 동안 실행될 수 있음을 확인
- 에이전트 시스템은 이제 청킹 없이 전체 차이를 처리할 수 있어, 더 간단하고 토큰 효율적인 하네스에서 더 높은 품질의 리뷰가 가능
- 과학 연구 시스템은 수백 편의 논문, 증명, 코드베이스를 단일 패스로 통합할 수 있음
📖 전체 소스 읽기: HN AI Agents
👀 See Also

AWS Bedrock, 클로드 오퍼스 4.7 할당량을 조용히 제거: 프로덕션 AI 워크플로우에 대한 경고
한 HN 사용자가 AWS Bedrock이 경고 없이 Claude Opus 4.7 할당량을 0으로 설정했다고 보고했습니다. AWS 지원팀은 시스템 업데이트 때문이며 복원을 보장할 수 없다고 확인했습니다. 사용자들은 Opus 4.6으로 마이그레이션하거나 제공자를 전환하라는 조언을 받고 있습니다.

OpenAI의 샘 알트먼, Anthropic의 국방부 협력 한계선 지지하며 기술적 안전장치 제안
오픈AI CEO 샘 알트먼은 대량 감시 및 자율 무기 체계를 위한 국방부 AI 사용에 대한 Anthropic의 윤리적 입장을 지지하면서, 클라우드 전용 배포와 같은 기술적 안전장치를 해결책으로 제안했습니다.

클로드 코드 캐시 버그로 API 비용이 10-20배 증가할 수 있습니다
Claude Code의 두 가지 캐시 버그가 API 비용을 10~20배까지 조용히 증가시킬 수 있습니다. 이 문제는 Reddit에서 보고되었으며 Hacker News에서 논의되었습니다.

Qwen3.5-122B on Blackwell SM120: fp8 KV 캐시 손상 문제 및 성능 분석 결과
8x RTX PRO 6000 Blackwell 하드웨어에서 Qwen3.5-122B를 테스트한 결과, fp8_e4m3 KV 캐시가 오류 없이 조용히 손상된 출력을 생성하는 문제가 발견되어 bf16 KV 캐시를 사용해야 합니다. MTP 최적화는 단일 요청 속도를 2.75배 향상시켰지만, DeltaNet 제약으로 인해 다른 최적화는 차단되었습니다.