제미니 3.1 플래시 라이브: 향상된 벤치마크와 워터마킹 기능을 갖춘 구글의 최신 오디오 모델

✍️ OpenClawRadar📅 게시일: March 26, 2026🔗 Source
제미니 3.1 플래시 라이브: 향상된 벤치마크와 워터마킹 기능을 갖춘 구글의 최신 오디오 모델
Ad

Gemini 3.1 Flash Live의 새로운 점

구글은 실시간 대화를 위해 설계된 최고 품질의 오디오 및 음성 모델인 Gemini 3.1 Flash Live를 출시했습니다. 이 모델은 음성 중심 AI 애플리케이션을 위해 향상된 속도와 자연스러운 리듬을 제공합니다.

주요 기술 사항

  • 벤치마크 점수: ComplexFuncBench Audio(제약 조건이 있는 다단계 함수 호출)에서 90.8%, Scale AI의 Audio MultiChallenge(복잡한 지시 사항을 '생각하며' 따르기)에서 36.1%
  • 향상된 기능: 더 나은 음조 이해, 피치와 속도 같은 음향적 뉘앙스 인식, 사용자의 좌절감이나 혼란에 대한 동적 조정
  • 워터마킹: 생성된 모든 오디오에는 AI 콘텐츠 감지를 위한 SynthID 워터마크가 포함됨
  • 다국어 지원: 200개 이상의 국가 및 지역에서 이용 가능

이용 가능성 및 접근성

  • 개발자용: Google AI Studio의 Gemini Live API를 통해 미리보기로 이용 가능
  • 기업용: Gemini Enterprise for Customer Experience에 포함됨
  • 일반 사용자용: Search Live와 Gemini Live를 통해 접근 가능

이 모델은 시끄러운 환경에서 복잡한 작업을 처리하는 음성 준비 에이전트 구축을 가능하게 하며, 장시간 상호작용 중 더 긴 대화 스레드를 지원합니다.

📖 Read the full source: HN AI Agents

Ad

👀 See Also