PageAgent: ИИ-агент в браузере с поддержкой Ollama

Что делает PageAgent

PageAgent — это фреймворк для ИИ-агентов в браузере, который работает как JavaScript-библиотека внутри самих веб-страниц, в отличие от большинства фреймворков, таких как Playwright или Selenium, которые управляют браузером извне.

Ключевые технические детали

Агент считывает DOM в реальном времени как текст, устраняя необходимость в скриншотах или моделях компьютерного зрения, что делает его быстрее и эффективнее по токенам.

Он работает с любой OpenAI-совместимой конечной точкой, включая Ollama. При использовании с локальной моделью всё остаётся на вашем компьютере без необходимости в бэкенде или облаке — вызовы LLM идут прямо из браузера на localhost.

Пример кода

const agent = new PageAgent({ 
  model: 'qwen3.5:27b', 
  baseURL: 'http://localhost:11434/v1', 
})
await agent.execute('Fill the expense report for last Friday')

Дополнительные возможности

Панель "человек в цикле", позволяющая видеть ход мыслей агента и останавливать/исправлять его в любой момент
Опциональное расширение для браузера для задач с несколькими вкладками
Лицензия MIT

Проект доступен на GitHub по адресу alibaba/page-agent.

📖 Read the full source: r/LocalLLaMA

PageAgent: Браузерный ИИ-агент, работающий внутри веб-страниц с поддержкой Ollama

Что делает PageAgent

Ключевые технические детали

Пример кода

Дополнительные возможности

👀 Смотрите также

Agent MCP Studio: Создавайте мультиагентные MCP-системы полностью в браузере через WASM

LumaBrowser: Браузер на Electron передает парсинг DOM локальным LLM для AI-агентов

Плагин Claude Code Yoink заменяет зависимости библиотек для снижения рисков в цепочке поставок

Репозиторий GitHub с лучшими практиками для Claude Code достиг 5 000 звёзд.