Дублёр: Обучаемый настольный агент, который осваивает задачи через демонстрацию

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source
Дублёр: Обучаемый настольный агент, который осваивает задачи через демонстрацию
Ad

Что делает Understudy

Understudy — это обучаемый настольный агент, который управляет вашим компьютером как коллега-человек — обрабатывая GUI, браузер, командную строку, файловую систему и инструменты обмена сообщениями в одной локальной среде выполнения. Ключевая инновация — обучение на примере: вы выполняете задачу один раз, агент записывает видео с экрана вместе с семантическими событиями, извлекает намерение (а не просто координаты) и превращает это в повторно используемый навык.

Текущий статус реализации

Система спроектирована как пять уровней, с текущим статусом реализации:

  • Уровень 1 (Работа с ПО нативно): Реализован сегодня на macOS. Управляет любым настольным приложением macOS с использованием 13 инструментов + скриншотная привязка + нативный ввод.
  • Уровень 2 (Обучение на демонстрациях): Реализован и готов к использованию сегодня. Пользователь показывает задачу один раз — агент извлекает намерение, проверяет, обучается.
  • Уровень 3 (Кристаллизованная память): Частично реализован. Агент накапливает опыт из ежедневного использования, закрепляет успешные пути.
  • Уровень 4 (Оптимизация маршрутов): Частично реализован. Автоматически обнаруживает и переключается на более быстрые пути выполнения.
  • Уровень 5 (Проактивная автономия): Остаётся долгосрочной целью. Замечает и действует в своём рабочем пространстве, не мешая пользователю.
Ad

Технические возможности

Understudy — это унифицированная среда выполнения для настольных систем, которая объединяет все пути выполнения в одном цикле агента, одной сессии, одном конвейере политик:

  • GUI: 13 инструментов + скриншотная привязка + нативный ввод для любого настольного приложения macOS
  • Браузер: Управляемый Playwright + ретранслятор расширения Chrome для любого веб-сайта с сессиями входа
  • Командная строка: Инструмент bash с полным локальным доступом для CLI-инструментов, скриптов, файловой системы
  • Веб: web_search + web_fetch для получения информации в реальном времени
  • Память: Семантическая память между сессиями для постоянного контекста и предпочтений
  • Обмен сообщениями: Поддержка 8 каналов

Как это работает на практике

В демонстрационном видео создатель обучает Understudy: поиск изображений в Google → загрузка фото → удаление фона в Pixelmator Pro → экспорт → отправка через Telegram. Затем просит сделать то же самое для Илона Маска. Воспроизведение — это не хрупкий макрос — опубликованный навык хранит шаги намерения, варианты маршрутов и подсказки GUI только как запасной вариант. Он может предпочитать более быстрые маршруты, когда они доступны, вместо повторения каждого шага GUI.

Установка и настройка

Текущая платформа: только macOS. Установка через npm:

npm install -g @understudy-ai/understudy
understudy wizard

Опубликованный артефакт навыка из демонстрационного примера доступен по адресу examples/published-skills/taught-person-photo-cutout-bc88ec/SKILL.md для ознакомления.

Для кого это

Разработчики, которые работают с несколькими настольными приложениями и хотят автоматизировать повторяющиеся задачи без создания пользовательских интеграций или конструкторов рабочих процессов.

📖 Read the full source: HN AI Agents

Ad

👀 Смотрите также

Skillware добавляет генератор синтетических данных с оценкой энтропии для тонкой настройки локальных моделей.
Инструменты

Skillware добавляет генератор синтетических данных с оценкой энтропии для тонкой настройки локальных моделей.

Skillware выпустила новый навык генератора синтетических данных, который использует эвристики коэффициента сжатия zlib для оценки разнообразия вывода, помогая предотвратить коллапс модели. Инструмент работает из коробки с Ollama, поддерживает Gemini/Anthropic для высокоуровневых пакетов рассуждений и выводит JSON-пакеты для конвейеров тонкой настройки .jsonl.

OpenClawRadar
Репозиторий бесплатного руководства по запуску продуктов на основе ИИ для пользователей Claude
Инструменты

Репозиторий бесплатного руководства по запуску продуктов на основе ИИ для пользователей Claude

Разработчик выпустил бесплатный репозиторий, содержащий структурированное руководство по запуску ИИ-продуктов, предназначенное для работы с Claude. Репозиторий организует опыт запуска в практические этапы, включая стратегию, подготовку, исполнение, а также содержит шаблоны и ссылки на инструменты.

OpenClawRadar
Стартовый набор Next.js с открытым исходным кодом добавляет ограничения и инструкции для агента для предотвращения "AI slop"
Инструменты

Стартовый набор Next.js с открытым исходным кодом добавляет ограничения и инструкции для агента для предотвращения "AI slop"

Новый шаблон Next.js включает аутентификацию, базу данных, CI, тесты и инструкции для Claude Code из коробки, предназначенный для разработчиков, использующих ИИ-агентов для написания кода, чтобы быстрее создавать production-приложения.

OpenClawRadar
Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE
Инструменты

Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE

Resonant Genesis AI IDE интегрирует поддержку локальных LLM как полноценного провайдера наряду с Groq, OpenAI, Anthropic и Gemini в более чем 30 микросервисах, используя общую библиотеку UnifiedLLMClient с автоматической цепочкой отказов.

OpenClawRadar