PageAgent: Браузерный ИИ-агент, работающий внутри веб-страниц с поддержкой Ollama

Что делает PageAgent
PageAgent — это фреймворк для ИИ-агентов в браузере, который работает как JavaScript-библиотека внутри самих веб-страниц, в отличие от большинства фреймворков, таких как Playwright или Selenium, которые управляют браузером извне.
Ключевые технические детали
Агент считывает DOM в реальном времени как текст, устраняя необходимость в скриншотах или моделях компьютерного зрения, что делает его быстрее и эффективнее по токенам.
Он работает с любой OpenAI-совместимой конечной точкой, включая Ollama. При использовании с локальной моделью всё остаётся на вашем компьютере без необходимости в бэкенде или облаке — вызовы LLM идут прямо из браузера на localhost.
Пример кода
const agent = new PageAgent({
model: 'qwen3.5:27b',
baseURL: 'http://localhost:11434/v1',
})
await agent.execute('Fill the expense report for last Friday')Дополнительные возможности
- Панель "человек в цикле", позволяющая видеть ход мыслей агента и останавливать/исправлять его в любой момент
- Опциональное расширение для браузера для задач с несколькими вкладками
- Лицензия MIT
Проект доступен на GitHub по адресу alibaba/page-agent.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

CloudRouter предоставляет возможности AI-кодирующим агентам с управлением ВМ и GPU.
CloudRouter представляет собой инструмент CLI, который позволяет ИИ-агентам кодирования автономно запускать облачные ВМ и ГПУ, автоматизируя такие задачи, как проверка браузера и трудоемкие вычисления на ГПУ.

Claude Code v2.1.139 добавляет команду /goal для асинхронных длительных задач
Claude Code v2.1.139 представляет команду /goal, позволяющую запускать сеансы по принципу «забыл и забыл», которые выполняются до достижения условия завершения, а также новый просмотр агентов для отслеживания активных сеансов.

Плагин Claude Code /verify: автоматическое тестирование браузера из вашего плана
/verify — это плагин с открытым исходным кодом для Claude Code, который читает ваш план, запускает настоящий браузер через Playwright MCP, проверяет каждое требование и выдает отчет о прохождении/непрохождении со скриншотами.

Исследователи из Стэнфорда выпустили OpenJarvis: фреймворк для локальных AI-агентов, работающих на устройствах.
Исследователи из Стэнфорда выпустили OpenJarvis, локально-ориентированный фреймворк для создания персональных ИИ-агентов на устройстве с инструментами, памятью и возможностями обучения. Проект включает ссылки на репозиторий GitHub и веб-сайт для разработчиков.