머큐리 2: 실시간 AI 코딩을 위한 확산 기반 모델

Ad
머큐리 2란 무엇인가
머큐리 2는 확산 기반 AI 모델로, 토큰을 순차적으로가 아닌 병렬로 생성하며, 여러 단계에 걸쳐 출력을 개선하는 과정을 사용합니다. 이 접근 방식은 토큰을 하나씩 디코딩하는 기존의 자기회귀 모델과 다릅니다.
기술 사양
- 생성 방식: 순차적인 토큰별 디코딩 대신 확산 기반 생성
- 처리 접근법: 토큰을 병렬로 생성하고 몇 단계에 걸쳐 개선
- 성능: NVIDIA Blackwell GPU에서 1,009 토큰/초 달성 주장
- 가격: 입력 토큰 100만 개당 $0.25, 출력 토큰 100만 개당 $0.75
- 컨텍스트 윈도우: 128K 토큰
- 추론 능력: 조정 가능한 추론
- 도구 통합: 스키마 정렬 JSON 출력과 함께 기본 도구 사용
- API 호환성: OpenAI API 호환
목표 사용 사례
개발자들은 머큐리 2를 다음과 같은 용도로 포지셔닝하고 있습니다:
- 코딩 어시스턴트
- 에이전트 루프(다단계 추론 체인)
- 실시간 음성 시스템
- 다중 홉 검색이 있는 RAG/검색 파이프라인
📖 전체 출처 읽기: r/LocalLLaMA
Ad
👀 See Also

News
Claude.ai에서 오류 증가 및 로그인 문제 발생 중
Claude.ai가 플랫폼에 영향을 미치는 오류 증가를 보고하고 있으며, 특히 Claude Code의 로그인 문제가 포함됩니다. 이 사건은 2026년 3월 11일 17:19:35 UTC에 공식적으로 게시되었습니다.
OpenClawRadar

News
클로드 코워크는 슬래시 명령어와 스킬을 단일 개념으로 통합합니다.
클로드 코워크는 슬래시 명령어와 스킬을 '스킬'이라는 단일 개념으로 통합하여 / 메뉴에서 별도의 헤더를 제거했습니다. 기존 명령어는 이전과 동일하게 작동합니다.
OpenClawRadar

News
Gemma 4 초기 신호: 로컬 에이전트 워크플로우에서는 과대 광고보다 배포 적합성이 중요하다
Gemma 4의 출시는 개인용 하드웨어와 엣지/모바일을 위한 공식 포지셔닝과 함께 다양한 하드웨어 계층에 걸친 배포를 강조하며, NVIDIA의 NVFP4 양자화가 GPQA에서 99.7%의 기준 성능 유지와 함께 4배 압축을 보여주고, Arena 순위에서 31B 조밀 모델이 약 27위에 위치하고 있습니다.
OpenClawRadar

News
온타리오 감사: AI 기록 시스템의 60%가 약물을 혼동하고, 85%가 정신 건강 세부사항을 놓친다
온타리오주 감사관은 20개의 AI 필기 시스템 중 12개가 잘못된 약물 정보를 삽입하고, 9개가 치료 제안을 조작했으며, 17개가 의사-환자 녹음에서 핵심 정신 건강 세부 사항을 누락했다는 사실을 발견했습니다. 평가는 정확성에 전체 점수의 4%만을 가중치로 부여했습니다.
OpenClawRadar