머큐리 2: 실시간 AI 코딩을 위한 확산 기반 모델

✍️ OpenClawRadar📅 게시일: February 25, 2026🔗 Source

머큐리 2: 실시간 AI 코딩을 위한 확산 기반 모델

Ad

머큐리 2란 무엇인가

머큐리 2는 확산 기반 AI 모델로, 토큰을 순차적으로가 아닌 병렬로 생성하며, 여러 단계에 걸쳐 출력을 개선하는 과정을 사용합니다. 이 접근 방식은 토큰을 하나씩 디코딩하는 기존의 자기회귀 모델과 다릅니다.

기술 사양

생성 방식: 순차적인 토큰별 디코딩 대신 확산 기반 생성
처리 접근법: 토큰을 병렬로 생성하고 몇 단계에 걸쳐 개선
성능: NVIDIA Blackwell GPU에서 1,009 토큰/초 달성 주장
가격: 입력 토큰 100만 개당 $0.25, 출력 토큰 100만 개당 $0.75
컨텍스트 윈도우: 128K 토큰
추론 능력: 조정 가능한 추론
도구 통합: 스키마 정렬 JSON 출력과 함께 기본 도구 사용
API 호환성: OpenAI API 호환

목표 사용 사례

개발자들은 머큐리 2를 다음과 같은 용도로 포지셔닝하고 있습니다:

코딩 어시스턴트
에이전트 루프(다단계 추론 체인)
실시간 음성 시스템
다중 홉 검색이 있는 RAG/검색 파이프라인

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

소라 AI 비디오 경제학: 사용자당 20달러, OpenAI의 컴퓨팅 비용은 65달러

소라 AI 비디오 경제학: 사용자당 20달러, OpenAI의 컴퓨팅 비용은 65달러

OpenAI의 Sora AI 비디오 생성 앱은 월 20달러 사용자당 65달러의 컴퓨팅 비용이 소요되며, 최고 추론 비용은 일일 1,500만 달러로 추정되지만, 총 수명 수익은 210만 달러에 불과한 것으로 알려졌습니다.

Apr 6, 2026, 01:45 AM UTC

클로드 오퍼스 4.7, 오류 증가 문제 발생 — 상태 업데이트

클로드 오퍼스 4.7, 오류 증가 문제 발생 — 상태 업데이트

자동 상태 업데이트에서 Claude Opus 4.7에 오류 증가가 보고되었습니다. 인시던트 페이지와 커뮤니티 메가스레드에서 진행 상황을 확인하세요.

Jun 2, 2026, 12:18 PM UTC

AWS Bedrock, 클로드 오퍼스 4.7 할당량을 조용히 제거: 프로덕션 AI 워크플로우에 대한 경고

AWS Bedrock, 클로드 오퍼스 4.7 할당량을 조용히 제거: 프로덕션 AI 워크플로우에 대한 경고

한 HN 사용자가 AWS Bedrock이 경고 없이 Claude Opus 4.7 할당량을 0으로 설정했다고 보고했습니다. AWS 지원팀은 시스템 업데이트 때문이며 복원을 보장할 수 없다고 확인했습니다. 사용자들은 Opus 4.6으로 마이그레이션하거나 제공자를 전환하라는 조언을 받고 있습니다.

May 2, 2026, 12:16 AM UTC

Anthropic, Claude 구독 한도에서 타사 하네스 차단, 우회 방법 존재

Anthropic, Claude 구독 한도에서 타사 하네스 차단, 우회 방법 존재

Anthropic이 Claude 구독 한도에 대한 제3자 하네스 접근을 제한하여, 이러한 도구에 의존하는 워크플로우를 방해할 가능성이 있습니다. 한 Reddit 사용자는 몇 달 동안의 훈련 데이터를 거의 잃을 뻔한 후 오픈소스 해결책을 개발했다고 보고했습니다.

Apr 15, 2026, 09:45 AM UTC