Google DeepMind AI Pointer: Переосмысление мыши для взаимодействия с Gemini

✍️ OpenClawRadar📅 Опубликовано: 12 мая 2026 г.🔗 Source
Ad

Google DeepMind представил AI-управляемый указатель — прототип, который расширяет традиционный курсор мыши контекстной осведомленностью на базе Gemini. Основная идея: вместо перетаскивания контента в окно AI-инструмента пользователи могут указывать на любой элемент на экране и отдавать команды на естественном языке (например, указать на изображение здания и сказать «Покажи маршруты»). ИИ понимает как визуальный, так и семантический контекст, превращая пиксели в интерактивные объекты (места, даты, предметы).

Четыре принципа взаимодействия

  • Сохранение потока: ИИ работает во всех приложениях, а не в отдельном окне. Примеры: указать на PDF и попросить сводку в виде маркированного списка для вставки в письмо; навести курсор на таблицу и запросить круговую диаграмму; выделить рецепт и сказать «удвоить все ингредиенты».
  • Покажи и расскажи: Указатель захватывает визуальный и семантический контекст, поэтому не нужен подробный запрос. Просто укажите, и ИИ поймет, какое слово, абзац, часть изображения или блок кода актуален.
  • Используйте силу «Это» и «То»: Используйте естественные сокращения, такие как «Исправь это», «Перемести это туда» или «Что это значит?» — ИИ сочетает жест, контекст и речь, чтобы вывести намерение.
  • Превращайте пиксели в интерактивные сущности: Фотография заметки от руки становится интерактивным списком задач; остановленный кадр в видео о путешествиях — ссылкой на бронирование показанного ресторана.
Ad

Интеграция в продукты

DeepMind внедряет эти возможности в двух направлениях:

  • Chrome (интеграция с Gemini): Укажите на часть веб-страницы и спросите о ней Gemini. Пример: выберите несколько товаров и попросите сравнить их, или укажите, где вы хотите визуализировать новый диван.
  • Googlebook (Magic Pointer): Грядущая функция для ноутбука Googlebook, которая помещает Gemini «у вас под рукой» для интуитивного взаимодействия.

Экспериментальные демо также доступны в Google AI Studio для редактирования изображений или поиска мест на карте с помощью указания и голоса. Команда также тестирует будущие концепции через платформу Disco от Google Labs.

Для кого это: Разработчики, создающие интерфейсы AI-агентов, UX-исследователи и все, кто работает над паттернами взаимодействия человека и ИИ.

📖 Read the full source: HN AI Agents

Ad

👀 Смотрите также

OpenClaw 2026.3.22-beta.1: Ключевые изменения в рабочем процессе для разработчиков плагинов и автоматизации браузера
Новости

OpenClaw 2026.3.22-beta.1: Ключевые изменения в рабочем процессе для разработчиков плагинов и автоматизации браузера

В OpenClaw 2026.3.22-beta.1 изменена установка плагинов с предпочтением ClawHub перед npm, удалён ретранслятор расширения Chrome, объединена генерация изображений и представлены критические изменения в Plugin SDK.

OpenClawRadar
Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей
Новости

Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей

Разработчик, работающий с клиентами, чувствительными к вопросам национальной безопасности, сообщает о вынужденном выборе между устаревшими открытыми моделями США, такими как gpt-oss-120b, и более мощными китайскими моделями, такими как GLM и MiniMax, которые клиенты отвергают как угрозу национальной безопасности.

OpenClawRadar
Выпуск OpenClaw 2026.3.2: Секреты для продакшена, инструмент для PDF и более безопасные настройки по умолчанию.
Новости

Выпуск OpenClaw 2026.3.2: Секреты для продакшена, инструмент для PDF и более безопасные настройки по умолчанию.

OpenClaw 2026.3.2 представляет производственную систему секретов с отказоустойчивым поведением, нативный инструмент для работы с PDF с поддержкой моделей Anthropic и Google, а также более безопасные настройки по умолчанию, ограничивающие доступ к инструментам для новых установок.

OpenClawRadar
Последнее обновление сломало расширение Claude для VS Code на Windows из-за жестко заданного пути для Linux
Новости

Последнее обновление сломало расширение Claude для VS Code на Windows из-за жестко заданного пути для Linux

Недавнее обновление расширения VS Code от Anthropic жестко прописывает путь Linux, что ломает расширение на Windows. Возврат к предыдущей версии восстанавливает функциональность.

OpenClawRadar