El Puntero de IA de Google DeepMind: Reimaginando el Ratón para las Interacciones con Gemini

✍️ OpenClawRadar📅 Publicado: 12 de mayo de 2026🔗 Source
Ad

Google DeepMind ha presentado el puntero con IA, un prototipo que amplía el cursor tradicional del mouse con conciencia de contexto impulsada por Gemini. La idea central: en lugar de arrastrar contenido a la ventana de una herramienta de IA, los usuarios pueden señalar cualquier cosa en la pantalla y dar un comando en lenguaje natural (por ejemplo, señalar una imagen de un edificio y decir "Muéstrame las indicaciones"). La IA comprende tanto el contexto visual como el semántico, tratando los píxeles como entidades procesables (lugares, fechas, objetos).

Cuatro principios de interacción

  • Mantener el flujo: La IA funciona en todas las aplicaciones, no en una ventana separada. Ejemplos: señalar un PDF y pedir un resumen con viñetas para pegar en un correo; pasar el cursor sobre una tabla y solicitar un gráfico circular; resaltar una receta y decir "duplica todos los ingredientes".
  • Mostrar y decir: El puntero captura el contexto visual y semántico, por lo que no necesitas un aviso detallado. Solo señala, y la IA sabe qué palabra, párrafo, parte de la imagen o bloque de código es relevante.
  • Acepta el poder de 'Esto' y 'Eso': Usa abreviaturas naturales como "Arregla esto", "Mueve eso aquí" o "¿Qué significa esto?": la IA combina gesto, contexto y habla para inferir la intención.
  • Convierte píxeles en entidades procesables: Una foto de una nota garabateada se convierte en una lista de tareas interactiva; un fotograma pausado en un video de viajes se convierte en un enlace de reserva para el restaurante mostrado.
Ad

Integración en productos

DeepMind está implementando estas capacidades en dos lugares:

  • Chrome (integración con Gemini): Señala parte de una página web y pregúntale a Gemini al respecto. Ejemplo: selecciona varios productos y pide compararlos, o señala dónde quieres visualizar un nuevo sofá.
  • Googlebook (Magic Pointer): Una función próxima para la laptop Googlebook que pone a Gemini "al alcance de tus dedos" para interacciones intuitivas.

También hay demos experimentales disponibles en Google AI Studio para editar imágenes o encontrar lugares en un mapa señalando y hablando. El equipo también está probando conceptos futuros a través de la plataforma Disco de Google Labs.

Para quién es: Desarrolladores que crean interfaces de agentes de IA, investigadores de UX y cualquier persona que trabaje en patrones de interacción humano-IA.

📖 Lee la fuente completa: HN AI Agents

Ad

👀 Ver también

Error en el Código de Claude Reemplaza Umlauts Alemanes con Sustitutos ASCII
Noticias

Error en el Código de Claude Reemplaza Umlauts Alemanes con Sustitutos ASCII

Desde diciembre de 2025, Claude Code y la aplicación Claude.ai han estado reemplazando aleatoriamente las diéresis alemanas (ä, ö, ü, ß) con sustitutos ASCII (ae, oe, ue, ss). El error persiste a pesar de instrucciones explícitas y no se ha corregido durante más de 3 meses sin respuesta del soporte de Anthropic.

OpenClawRadar
Investigadores de la UW planean usar cámaras portadas por maestros para entrenamiento de IA, padres pueden optar por no participar
Noticias

Investigadores de la UW planean usar cámaras portadas por maestros para entrenamiento de IA, padres pueden optar por no participar

Investigadores de la Universidad de Washington planearon que educadoras de preescolar usaran cámaras en primera persona para grabar a los niños y entrenar modelos de IA, con un modelo de consentimiento de exclusión voluntaria.

OpenClawRadar
Opus 4.6 destaca en investigación, Gemini 3.1 Pro tiene mejor juicio en tareas de pronóstico
Noticias

Opus 4.6 destaca en investigación, Gemini 3.1 Pro tiene mejor juicio en tareas de pronóstico

Un benchmark de 1,417 preguntas de predicción binaria separa el rendimiento de investigación y juicio: Claude Opus 4.6 lidera en investigación agéntica, Gemini 3.1 Pro gana en calibración con evidencia fija. GPT-5.4 y Grok 4.20 muestran pocos cambios entre condiciones.

OpenClawRadar
GitHub Copilot se traslada a facturación basada en uso por consumo de tokens, reemplazando las solicitudes premium el 1 de junio de 2026
Noticias

GitHub Copilot se traslada a facturación basada en uso por consumo de tokens, reemplazando las solicitudes premium el 1 de junio de 2026

GitHub Copilot pasa de unidades de solicitud premium a GitHub AI Credits basados en tokens, sin cambios en los precios de los planes. Todos los planes de pago incluyen créditos mensuales equivalentes al costo de la suscripción; el uso adicional se factura según las tarifas de API.

OpenClawRadar