Протокол Agent Browser: открытый форк Chrome для ИИ-агентов достигает 90% на бенчмарке Mind2Web

✍️ OpenClawRadar📅 Опубликовано: 11 марта 2026 г.🔗 Source
Протокол Agent Browser: открытый форк Chrome для ИИ-агентов достигает 90% на бенчмарке Mind2Web
Ad

Протокол агентского браузера: браузер, созданный для ИИ-агентов

Протокол агентского браузера (ABP) — это открытая форк-версия браузера Chrome, специально разработанная для ИИ-агентов. Проект был создан как вызов — построить браузер, ориентированный на агентов, и занять первое место в Online Mind2Web Benchmark.

Ключевой технический подход

Основная идея ABP заключается в том, что ИИ-агенты отлично справляются с пошаговым чатом, но испытывают трудности с принятием решений в непрерывном времени. Чтобы максимизировать производительность больших языковых моделей (LLM) на задачах в браузере, ABP преобразует веб-сёрфинг в мультимодальный чат, выполняя следующие действия:

  • Замораживает JavaScript и время после каждого действия, так что веб-страница остаётся замороженной, пока агент обдумывает следующий шаг
  • Захватывает все соответствующие события, возникающие в результате действий, включая выбор файлов, загрузки, запросы разрешений и диалоговые окна
  • Возвращает эти события вместе со скриншотом замороженной страницы, чтобы агент мог целостно анализировать состояние браузера с полным контекстом

Производительность и разработка

ABP достиг 90,53% на тесте Online Mind2Web Benchmark, удерживая первое место в течение двух дней, пока GPT-5.4 не превзошёл его с результатом 92,8%. Разработчик использовал Claude Opus-4.5 для работы над проектом по вечерам и выходным, завершив его за два месяца.

Ad

Практическое применение

Согласно источнику, ABP особенно хорошо справляется с:

  • Заполнением форм
  • Онлайн-покупками
  • Загрузкой файлов
  • Выгрузкой файлов
  • Заказом еды на вынос
  • Обратной разработкой недокументированных API веб-сайтов

Начало работы

Чтобы добавить ABP в Claude Code:

claude mcp add browser -- npx -y agent-browser-protocol --mcp

После этого вы можете давать Claude команды, например:

Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.

Ресурсы

Репозиторий на GitHub: https://github.com/theredsix/agent-browser-protocol

Результаты тестирования: https://github.com/theredsix/abp-online-mind2web-results

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

OMAR: Открытая TUI для иерархического управления сотнями AI-агентов кодирования
Инструменты

OMAR: Открытая TUI для иерархического управления сотнями AI-агентов кодирования

OMAR — это терминальная панель управления, которая позволяет управлять роями кодирующих агентов (Claude Code, Codex, Cursor, Opencode) в иерархических организациях. Основан на tmux. Поддерживает иерархии агентов, управляющих агентами, гетерогенные бэкенды и интеграцию со Slack.

OpenClawRadar
TechDebtMCP v2.0.0: MCP-сервер для анализа технического долга на 14 языках
Инструменты

TechDebtMCP v2.0.0: MCP-сервер для анализа технического долга на 14 языках

TechDebtMCP v2.0.0 — это MCP-сервер, который подключает Claude к вашей кодовой базе для анализа технического долга. После подключения вы можете задавать Claude вопросы о техническом долге, проблемах безопасности и качестве кода.

OpenClawRadar
Loom: Локальный исполнительный механизм для сложных задач искусственного интеллекта
Инструменты

Loom: Локальный исполнительный механизм для сложных задач искусственного интеллекта

Loom — это открытый локальный исполнительный фреймворк, предназначенный для управления сложными задачами. Он предоставляет структурированный процесс с примерно 50 инструментами, системой плагинов пользовательских пакетов для повторяющихся рабочих процессов, а также интерфейсы CLI и MCP-сервера.

OpenClawRadar
Расширение Microsoft DebugMCP для VS Code предоставляет AI-агентам возможности отладки.
Инструменты

Расширение Microsoft DebugMCP для VS Code предоставляет AI-агентам возможности отладки.

Microsoft DebugMCP — это расширение для VS Code, которое предоставляет полный доступ к отладчику VS Code для ИИ-агентов программирования через Model Context Protocol (MCP), позволяя им устанавливать точки останова, пошагово выполнять код, проверять переменные и вычислять выражения.

OpenClawRadar