Google DeepMind AI Pointer: Переосмысление мыши для взаимодействия с Gemini
Google DeepMind представил AI-управляемый указатель — прототип, который расширяет традиционный курсор мыши контекстной осведомленностью на базе Gemini. Основная идея: вместо перетаскивания контента в окно AI-инструмента пользователи могут указывать на любой элемент на экране и отдавать команды на естественном языке (например, указать на изображение здания и сказать «Покажи маршруты»). ИИ понимает как визуальный, так и семантический контекст, превращая пиксели в интерактивные объекты (места, даты, предметы).
Четыре принципа взаимодействия
- Сохранение потока: ИИ работает во всех приложениях, а не в отдельном окне. Примеры: указать на PDF и попросить сводку в виде маркированного списка для вставки в письмо; навести курсор на таблицу и запросить круговую диаграмму; выделить рецепт и сказать «удвоить все ингредиенты».
- Покажи и расскажи: Указатель захватывает визуальный и семантический контекст, поэтому не нужен подробный запрос. Просто укажите, и ИИ поймет, какое слово, абзац, часть изображения или блок кода актуален.
- Используйте силу «Это» и «То»: Используйте естественные сокращения, такие как «Исправь это», «Перемести это туда» или «Что это значит?» — ИИ сочетает жест, контекст и речь, чтобы вывести намерение.
- Превращайте пиксели в интерактивные сущности: Фотография заметки от руки становится интерактивным списком задач; остановленный кадр в видео о путешествиях — ссылкой на бронирование показанного ресторана.
Интеграция в продукты
DeepMind внедряет эти возможности в двух направлениях:
- Chrome (интеграция с Gemini): Укажите на часть веб-страницы и спросите о ней Gemini. Пример: выберите несколько товаров и попросите сравнить их, или укажите, где вы хотите визуализировать новый диван.
- Googlebook (Magic Pointer): Грядущая функция для ноутбука Googlebook, которая помещает Gemini «у вас под рукой» для интуитивного взаимодействия.
Экспериментальные демо также доступны в Google AI Studio для редактирования изображений или поиска мест на карте с помощью указания и голоса. Команда также тестирует будущие концепции через платформу Disco от Google Labs.
Для кого это: Разработчики, создающие интерфейсы AI-агентов, UX-исследователи и все, кто работает над паттернами взаимодействия человека и ИИ.
📖 Read the full source: HN AI Agents
👀 Смотрите также

OpenClaw 2026.3.22-beta.1: Ключевые изменения в рабочем процессе для разработчиков плагинов и автоматизации браузера
В OpenClaw 2026.3.22-beta.1 изменена установка плагинов с предпочтением ClawHub перед npm, удалён ретранслятор расширения Chrome, объединена генерация изображений и представлены критические изменения в Plugin SDK.

Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей
Разработчик, работающий с клиентами, чувствительными к вопросам национальной безопасности, сообщает о вынужденном выборе между устаревшими открытыми моделями США, такими как gpt-oss-120b, и более мощными китайскими моделями, такими как GLM и MiniMax, которые клиенты отвергают как угрозу национальной безопасности.

Выпуск OpenClaw 2026.3.2: Секреты для продакшена, инструмент для PDF и более безопасные настройки по умолчанию.
OpenClaw 2026.3.2 представляет производственную систему секретов с отказоустойчивым поведением, нативный инструмент для работы с PDF с поддержкой моделей Anthropic и Google, а также более безопасные настройки по умолчанию, ограничивающие доступ к инструментам для новых установок.

Последнее обновление сломало расширение Claude для VS Code на Windows из-за жестко заданного пути для Linux
Недавнее обновление расширения VS Code от Anthropic жестко прописывает путь Linux, что ломает расширение на Windows. Возврат к предыдущей версии восстанавливает функциональность.