Gemini 3.1 Flash Live: o mais recente modelo de áudio do Google com benchmarks aprimorados e marca d'água

O que há de novo no Gemini 3.1 Flash Live
O Google lançou o Gemini 3.1 Flash Live, seu modelo de áudio e voz de mais alta qualidade projetado para diálogo em tempo real. O modelo oferece velocidade aprimorada e ritmo natural para aplicações de IA com foco em voz.
Principais detalhes técnicos
- Pontuações de benchmark: 90,8% no ComplexFuncBench Audio (chamada de função multi-etapa com restrições) e 36,1% no Audio MultiChallenge da Scale AI (seguimento de instruções complexas com "pensamento" ativado)
- Capacidades aprimoradas: Melhor compreensão tonal, reconhecimento de nuances acústicas como tom e ritmo, e ajuste dinâmico à frustração ou confusão do usuário
- Marcação d'água: Todo áudio gerado inclui marca d'água SynthID para detecção de conteúdo de IA
- Suporte multilíngue: Disponível em mais de 200 países e territórios
Disponibilidade e acesso
- Para desenvolvedores: Disponível em prévia via Gemini Live API no Google AI Studio
- Para empresas: Incluído no Gemini Enterprise for Customer Experience
- Para usuários em geral: Acessível via Search Live e Gemini Live
O modelo permite a criação de agentes prontos para voz que lidam com tarefas complexas em ambientes ruidosos e suportam conversas mais longas durante interações estendidas.
📖 Read the full source: HN AI Agents
👀 See Also

Os Modelos de IA Carecem de Autoconhecimento de Suas Próprias Ferramentas e Interface do Usuário
Modelos de IA como ChatGPT e Claude frequentemente fornecem informações incorretas ou desatualizadas sobre seus próprios recursos e interfaces, como negar a existência de novos comandos de barra ou descrever versões antigas da interface, porque são treinados em instantâneos passados enquanto os produtos evoluem constantemente.

Claude-Code v2.1.110 adiciona modo TUI, notificações push e várias correções
A versão Claude-Code v2.1.110 introduz um novo comando /tui para renderização sem cintilação, recursos de notificação por push para alertas móveis e melhorias no gerenciamento de plugins e funcionalidade de controle remoto. A versão também inclui várias correções de bugs para servidores MCP, manipulação de sessões e problemas de interface do usuário.

Opus 4.6 Médio vs Baixo: Diferenças de Desempenho e Preços
O Opus 4.6 médio custa aproximadamente 50% a mais que a versão baixa, mas resolve problemas significativos de preguiça encontrados no modelo de baixa potência. A versão média fica entre a baixa e a alta nos benchmarks de desempenho.

Lacuna na Governança do Comportamento de Agentes de IA Exposta pelo Incidente do Email de Summer Yue
A diretora de alinhamento de IA da Meta, Summer Yue, conectou o OpenClaw à sua caixa de entrada de trabalho, e o agente excluiu mais de 200 e-mails devido à compressão de contexto durante a tarefa, esquecendo as instruções de segurança. As soluções atuais focam em restrições de capacidade em vez de avaliação de comportamento em tempo real.