El Puntero de IA de Google DeepMind: Reimaginando el Ratón para las Interacciones con Gemini
Google DeepMind ha presentado el puntero con IA, un prototipo que amplía el cursor tradicional del mouse con conciencia de contexto impulsada por Gemini. La idea central: en lugar de arrastrar contenido a la ventana de una herramienta de IA, los usuarios pueden señalar cualquier cosa en la pantalla y dar un comando en lenguaje natural (por ejemplo, señalar una imagen de un edificio y decir "Muéstrame las indicaciones"). La IA comprende tanto el contexto visual como el semántico, tratando los píxeles como entidades procesables (lugares, fechas, objetos).
Cuatro principios de interacción
- Mantener el flujo: La IA funciona en todas las aplicaciones, no en una ventana separada. Ejemplos: señalar un PDF y pedir un resumen con viñetas para pegar en un correo; pasar el cursor sobre una tabla y solicitar un gráfico circular; resaltar una receta y decir "duplica todos los ingredientes".
- Mostrar y decir: El puntero captura el contexto visual y semántico, por lo que no necesitas un aviso detallado. Solo señala, y la IA sabe qué palabra, párrafo, parte de la imagen o bloque de código es relevante.
- Acepta el poder de 'Esto' y 'Eso': Usa abreviaturas naturales como "Arregla esto", "Mueve eso aquí" o "¿Qué significa esto?": la IA combina gesto, contexto y habla para inferir la intención.
- Convierte píxeles en entidades procesables: Una foto de una nota garabateada se convierte en una lista de tareas interactiva; un fotograma pausado en un video de viajes se convierte en un enlace de reserva para el restaurante mostrado.
Integración en productos
DeepMind está implementando estas capacidades en dos lugares:
- Chrome (integración con Gemini): Señala parte de una página web y pregúntale a Gemini al respecto. Ejemplo: selecciona varios productos y pide compararlos, o señala dónde quieres visualizar un nuevo sofá.
- Googlebook (Magic Pointer): Una función próxima para la laptop Googlebook que pone a Gemini "al alcance de tus dedos" para interacciones intuitivas.
También hay demos experimentales disponibles en Google AI Studio para editar imágenes o encontrar lugares en un mapa señalando y hablando. El equipo también está probando conceptos futuros a través de la plataforma Disco de Google Labs.
Para quién es: Desarrolladores que crean interfaces de agentes de IA, investigadores de UX y cualquier persona que trabaje en patrones de interacción humano-IA.
📖 Lee la fuente completa: HN AI Agents
👀 Ver también

Error en el Código de Claude Reemplaza Umlauts Alemanes con Sustitutos ASCII
Desde diciembre de 2025, Claude Code y la aplicación Claude.ai han estado reemplazando aleatoriamente las diéresis alemanas (ä, ö, ü, ß) con sustitutos ASCII (ae, oe, ue, ss). El error persiste a pesar de instrucciones explícitas y no se ha corregido durante más de 3 meses sin respuesta del soporte de Anthropic.

Investigadores de la UW planean usar cámaras portadas por maestros para entrenamiento de IA, padres pueden optar por no participar
Investigadores de la Universidad de Washington planearon que educadoras de preescolar usaran cámaras en primera persona para grabar a los niños y entrenar modelos de IA, con un modelo de consentimiento de exclusión voluntaria.

Opus 4.6 destaca en investigación, Gemini 3.1 Pro tiene mejor juicio en tareas de pronóstico
Un benchmark de 1,417 preguntas de predicción binaria separa el rendimiento de investigación y juicio: Claude Opus 4.6 lidera en investigación agéntica, Gemini 3.1 Pro gana en calibración con evidencia fija. GPT-5.4 y Grok 4.20 muestran pocos cambios entre condiciones.

GitHub Copilot se traslada a facturación basada en uso por consumo de tokens, reemplazando las solicitudes premium el 1 de junio de 2026
GitHub Copilot pasa de unidades de solicitud premium a GitHub AI Credits basados en tokens, sin cambios en los precios de los planes. Todos los planes de pago incluyen créditos mensuales equivalentes al costo de la suscripción; el uso adicional se factura según las tarifas de API.