IA Pointer do Google DeepMind: Reimaginando o Mouse para Interações Gemini
O Google DeepMind revelou o ponteiro habilitado por IA, um protótipo que aumenta o cursor tradicional do mouse com consciência de contexto baseada no Gemini. A ideia central: em vez de arrastar conteúdo para a janela de uma ferramenta de IA, os usuários podem apontar para qualquer coisa na tela e dar um comando em linguagem natural (por exemplo, aponte para uma imagem de prédio e diga "Mostre-me as direções"). A IA entende tanto o contexto visual quanto o semântico, tratando pixels como entidades acionáveis (lugares, datas, objetos).
Quatro Princípios de Interação
- Mantenha o fluxo: A IA funciona em todos os aplicativos, não em uma janela separada. Exemplos: aponte para um PDF e peça um resumo em tópicos para colar em um e-mail; passe o mouse sobre uma tabela e solicite um gráfico de pizza; destaque uma receita e diga "dobre todos os ingredientes".
- Mostre e diga: O ponteiro captura contexto visual e semântico, então você não precisa de um prompt detalhado. Basta apontar, e a IA sabe qual palavra, parágrafo, parte da imagem ou bloco de código é relevante.
- Abrace o poder de 'Isso' e 'Aquilo': Use abreviações naturais como "Corrija isso", "Mova aquilo para cá" ou "O que isso significa?"—a IA combina gesto, contexto e fala para inferir a intenção.
- Transforme pixels em entidades acionáveis: Uma foto de um bilhete rabiscado se torna uma lista de tarefas interativa; um quadro pausado em um vídeo de viagem se torna um link de reserva para o restaurante mostrado.
Integração em Produtos
O DeepMind está lançando essas capacidades em dois lugares:
- Chrome (integração Gemini): Aponte para parte de uma página web e pergunte ao Gemini sobre ela. Exemplo: selecione alguns produtos e peça para compará-los, ou aponte para onde você quer visualizar um novo sofá.
- Googlebook (Magic Pointer): Um recurso futuro para o laptop Googlebook que coloca o Gemini "na ponta dos seus dedos" para interações intuitivas.
Demostrações experimentais também estão disponíveis no Google AI Studio para editar imagens ou encontrar lugares em um mapa apontando e falando. A equipe também está testando conceitos futuros através da plataforma Disco do Google Labs.
Para quem é: Desenvolvedores construindo interfaces de agentes de IA, pesquisadores de UX e qualquer pessoa trabalhando em padrões de interação humano-IA.
📖 Leia a fonte completa: HN AI Agents
👀 See Also
A Reação Pública Contra a IA é Real: Violência, Dados de Pesquisas e Retornos Decrescentes
Um ataque com coquetel molotov ao CEO da OpenAI, a raiva da Geração Z subindo para 31% e 80% das empresas sem ganho de produtividade — a lua de mel acabou para a IA.

Desbloqueando o Potencial do OpenClaw: Integração com o CodeX
Descubra como os usuários do OpenClaw podem invocar o CodeX de forma integrada para funcionalidades aprimoradas. Explore discussões dos usuários e métodos-chave neste tutorial envolvente.

ThermoQA: Benchmark Aberto para Testar LLMs em 293 Problemas de Cálculo de Termodinâmica de Engenharia
ThermoQA é um benchmark aberto com 293 problemas de termodinâmica de engenharia em três níveis, testando LLMs em cálculos numéricos exatos. Claude Opus 4.6 lidera com 94,1% de pontuação composta, enquanto DeepSeek-R1 mostra a maior variação entre execuções em ±2,5%.

IA é muito cara: Hiperescaladores precisam de US$ 3 trilhões para atingir o ponto de equilíbrio
Os hyperscalers investiram mais de US$ 800 bilhões em Capex de IA, com mais US$ 1 trilhão planejados para 2027. Só a Microsoft gastou ~US$ 100 bilhões na infraestrutura da OpenAI, mas a receita de IA cobre apenas ~20% do seu Capex.