Gemini 3.1 Flash Live: Новая аудиомодель Google с улучшенными показателями и водяными знаками

Что нового в Gemini 3.1 Flash Live
Google выпустила Gemini 3.1 Flash Live — свою самую качественную аудио- и голосовую модель, предназначенную для диалогов в реальном времени. Модель обеспечивает повышенную скорость и естественный ритм для голосовых AI-приложений.
Ключевые технические детали
- Результаты тестов: 90,8% на ComplexFuncBench Audio (многошаговый вызов функций с ограничениями) и 36,1% на Audio MultiChallenge от Scale AI (сложное выполнение инструкций с включённым «мышлением»)
- Улучшенные возможности: Лучшее понимание тональности, распознавание акустических нюансов, таких как высота тона и темп, а также динамическая адаптация к раздражению или замешательству пользователя
- Водяные знаки: Всё сгенерированное аудио включает водяной знак SynthID для обнаружения AI-контента
- Поддержка языков: Доступна в более чем 200 странах и территориях
Доступность
- Для разработчиков: Доступна в предварительной версии через Gemini Live API в Google AI Studio
- Для предприятий: Включена в Gemini Enterprise for Customer Experience
- Для обычных пользователей: Доступна через Search Live и Gemini Live
Модель позволяет создавать голосовые агенты, способные выполнять сложные задачи в шумной обстановке, и поддерживает более длинные цепочки диалогов при продолжительном взаимодействии.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Claude Code 2.1.63 добавляет встроенные слеш-команды, HTTP-хуки и исправления утечек памяти.
Anthropic выпустила Claude Code 2.1.63 с 26 изменениями в CLI, включая новые слеш-команды /simplify и /batch, HTTP-хуки, отправляющие JSON на URL-адреса, и исправления нескольких утечек памяти в длительных сессиях.

Anthropic платит SpaceX $15 млрд в год за вычислительные мощности до 2029 года
Документы SpaceX для IPO раскрывают, что Anthropic платит $1.25 млрд в месяц до мая 2029 года за вычислительные мощности. Сделка обеспечивает обучение ИИ на объектах Colossus 1 и 2.

Сбой сервиса Claude Code и проблемы с прозрачностью страницы статуса
Claude Code столкнулся с проблемами аутентификации из-за ежедневного истечения срока действия OAuth API-ключей и ошибками 500 при повторной авторизации, в то время как официальная страница статуса изначально не показывала никаких проблем, несмотря на сообщения пользователей о неполадках в течение как минимум 45 минут.

Искусственный интеллект не смог повысить продуктивность, согласно недавнему исследованию CEOs.
Несмотря на широкое внедрение ИИ, исследование 6000 руководителей сообщает о незначительных влияниях на производительность и занятость, что перекликается с парадоксом производительности, выявленным в эпоху ИТ 1980-х годов.