클로드 오푸스 4.8 출시: 더 빠르고 저렴한 패스트 모드, 동적 워크플로우, 정직성 개선

Anthropic이 오늘 Claude Opus 4.8을 출시하며, 코드 작성, 에이전트 능력, 추론 및 지식 작업 전반에 걸친 벤치마크 개선 사항으로 Opus 4.7을 업그레이드했습니다. 새 버전은 이전 모델과 동일한 가격으로 제공됩니다.
주요 기능
- 노력 제어 (claude.ai) — 사용자는 이제 Claude가 작업에 투입하는 노력 수준을 설정할 수 있습니다.
- 동적 워크플로 (Claude Code) — 모델이 매우 대규모 문제를 처리할 수 있도록 합니다.
- 고속 모드는 2.5배 빠른 속도로 실행되며, 이전 모델의 고속 모드보다 3배 저렴합니다.
벤치마크 하이라이트
발표에 따르면, Claude Opus 4.8은 Anthropic의 Super-Agent 벤치마크에서 모든 케이스를 엔드투엔드로 완료한 유일한 모델이며, 비용 동등성에서 이전 Opus 모델과 GPT-5.5를 능가합니다. Online-Mind2Web(컴퓨터 사용 및 브라우저 에이전트 작업)에서 84%를 기록하여 Opus 4.7과 GPT-5.5 모두를 크게 앞질렀습니다. CursorBench에서는 모든 노력 수준에서 이전 Opus 모델을 초과합니다.
Legal Agent Benchmark에서 Opus 4.8은 올패스 기준으로 전체 10%를 돌파한 최초의 모델입니다. 초기 테스터들은 도구 호출 효율성(동일한 지능에 더 적은 단계), 인용 정확성, 검색 워크플로의 토큰 효율성 개선도 보고했습니다.
정직성 훈련
Opus 4.8은 명시적인 정직성 개선을 도입했습니다. 모델은 뒷받침되지 않는 주장을 피하고 입력/출력 문제를 사전에 알리도록 훈련되었습니다. 이는 테스터 평가에서 더 높은 품질의 분석과 더 나은 신호 대 잡음비로 이어졌습니다.
가격
Opus 4.8은 Opus 4.7과 동일한 가격으로 제공됩니다. 고속 모드 가격은 이전 고속 모드 가격보다 3배 저렴합니다. 멀티모달 토큰 비용은 Genie(Databricks의 AI 에이전트) 기준 Opus 4.7보다 61% 저렴합니다.
📖 전체 출처 읽기: HN AI Agents
👀 See Also

구글, 국방부에 비밀 등급 없는 업무용 AI 에이전트 제공 예정
블룸버그 보고서에 따르면, 구글이 미 국방부에 비밀 분류되지 않은 업무용 AI 에이전트를 제공하기로 합의했습니다. 이 기사는 해커 뉴스에서 61점을 받고 52개의 댓글 논의를 불러일으켰습니다.

골드만삭스 분석, 2025년 미국 GDP 성장에 AI 영향 미미할 것으로 전망
골드만삭스 경제학자들은 2025년 미국 GDP 성장에 AI 투자가 '거의 제로'에 가까운 기여를 했다고 보고하며, 수입된 하드웨어와 측정되지 않은 생산성 영향이 주요 요인이라고 지적했습니다.

에이전트 메모리는 저장 문제가 아니라 권한 문제입니다
한 개발자는 에이전트 메모리의 문제가 검색 실패가 아니라 모든 노트가 동등한 권위를 가지고 반환되기 때문이라고 주장한다. 해결책은 역할, 만료, 활성화 필드가 있는 그래프다.

웨이모, 6세대 드라이버로 완전 자율 주행 운영 시작
웨이모의 6세대 드라이버가 완전 자율 주행 운영을 시작하며, 다중 모드 센싱 시스템과 차세대 1700만 화소 이미저를 특징으로 합니다.