Gemini 3.1 Flash Live: el último modelo de audio de Google con mejoras en los puntos de referencia y marca de agua.

Novedades en Gemini 3.1 Flash Live
Google ha lanzado Gemini 3.1 Flash Live, su modelo de audio y voz de mayor calidad diseñado para diálogos en tiempo real. El modelo ofrece una velocidad mejorada y un ritmo natural para aplicaciones de IA centradas en la voz.
Detalles técnicos clave
- Puntuaciones en pruebas: 90.8% en ComplexFuncBench Audio (llamadas a funciones de múltiples pasos con restricciones) y 36.1% en Audio MultiChallenge de Scale AI (seguimiento de instrucciones complejas con "pensamiento" activado)
- Capacidades mejoradas: Mejor comprensión tonal, reconocimiento de matices acústicos como tono y ritmo, y ajuste dinámico a la frustración o confusión del usuario
- Marca de agua: Todo el audio generado incluye marca de agua SynthID para detección de contenido de IA
- Soporte multilingüe: Disponible en más de 200 países y territorios
Disponibilidad y acceso
- Para desarrolladores: Disponible en vista previa a través de la API Gemini Live en Google AI Studio
- Para empresas: Incluido en Gemini Enterprise for Customer Experience
- Para usuarios generales: Accesible a través de Search Live y Gemini Live
El modelo permite crear agentes preparados para voz que manejan tareas complejas en entornos ruidosos y admite conversaciones más largas durante interacciones extendidas.
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

1.2B Modelo Local Vence a 1T Nubes en Póker: La Agresión Supera al Conocimiento en Formato Todo o Nada
Un modelo Liquid de 1.2B ganó 2 de 5 torneos de Texas Hold'em contra modelos de hasta 1T de parámetros, porque en un formato de stack corto, nunca retirarse generó más fichas que el juego inteligente.

El volumen de código generado por IA abruma a los ingenieros senior, según un estudio.
Los usuarios de IA fusionan un 98% más de pull requests con asistencia de IA, pero los ingenieros senior reportan mayor carga cognitiva y agotamiento. La investigación muestra que la detección de defectos cae del 87% para PRs menores a 100 líneas al 28% para PRs mayores a 1,000 líneas.

Clanker T1000 de Greg Kroah-Hartman: LLM local en Framework Desktop con AMD Ryzen AI Max fuzzeando errores del kernel de Linux
Greg KH's 'gregkh_clanker_t1000' utiliza un LLM local ejecutándose en un Framework Desktop (AMD Ryzen AI Max+) para fuzzear el kernel de Linux, resultando en ~20 parches fusionados desde el 7 de abril solucionando errores en ALSA, HID, SMB, Nouveau, IO_uring, y más.

Según informes, Nvidia está desarrollando NemoClaw de código abierto para competir con OpenClaw.
Informes recientes sugieren que Nvidia está trabajando en un proyecto de código abierto llamado NemoClaw, destinado a competir directamente con OpenClaw en herramientas de desarrollo de IA. Se espera que el proyecto se centre en mejorar el rendimiento, la escalabilidad y la flexibilidad para desarrolladores, manteniendo la compatibilidad con los flujos de trabajo modernos de IA.