Gemini 3.1 Flash Live: 90.8% на тесте ComplexFuncBench

Что нового в Gemini 3.1 Flash Live

Google выпустила Gemini 3.1 Flash Live — свою самую качественную аудио- и голосовую модель, предназначенную для диалогов в реальном времени. Модель обеспечивает повышенную скорость и естественный ритм для голосовых AI-приложений.

Ключевые технические детали

Результаты тестов: 90,8% на ComplexFuncBench Audio (многошаговый вызов функций с ограничениями) и 36,1% на Audio MultiChallenge от Scale AI (сложное выполнение инструкций с включённым «мышлением»)
Улучшенные возможности: Лучшее понимание тональности, распознавание акустических нюансов, таких как высота тона и темп, а также динамическая адаптация к раздражению или замешательству пользователя
Водяные знаки: Всё сгенерированное аудио включает водяной знак SynthID для обнаружения AI-контента
Поддержка языков: Доступна в более чем 200 странах и территориях

Доступность

Для разработчиков: Доступна в предварительной версии через Gemini Live API в Google AI Studio
Для предприятий: Включена в Gemini Enterprise for Customer Experience
Для обычных пользователей: Доступна через Search Live и Gemini Live

Модель позволяет создавать голосовые агенты, способные выполнять сложные задачи в шумной обстановке, и поддерживает более длинные цепочки диалогов при продолжительном взаимодействии.

📖 Read the full source: HN AI Agents

Gemini 3.1 Flash Live: Новая аудиомодель Google с улучшенными показателями и водяными знаками

Что нового в Gemini 3.1 Flash Live

Ключевые технические детали

Доступность

👀 Смотрите также

Старший правительственный руководитель по ИИ не осведомлён о местных LLM: рассказ разработчика

Экономика видео Sora AI: затраты OpenAI на вычисления составляют $65 при стоимости для пользователя в $20

18-месячный переписывание кодовой базы Autonoma: уроки по тестированию, техническому долгу и Server Actions

Claude Code превращается в инженерную ОС, а не просто в ИИ-чат для кода