Agent Browser Protocol: открытый форк Chrome с 90% на Mind2Web

Протокол агентского браузера: браузер, созданный для ИИ-агентов

Протокол агентского браузера (ABP) — это открытая форк-версия браузера Chrome, специально разработанная для ИИ-агентов. Проект был создан как вызов — построить браузер, ориентированный на агентов, и занять первое место в Online Mind2Web Benchmark.

Ключевой технический подход

Основная идея ABP заключается в том, что ИИ-агенты отлично справляются с пошаговым чатом, но испытывают трудности с принятием решений в непрерывном времени. Чтобы максимизировать производительность больших языковых моделей (LLM) на задачах в браузере, ABP преобразует веб-сёрфинг в мультимодальный чат, выполняя следующие действия:

Замораживает JavaScript и время после каждого действия, так что веб-страница остаётся замороженной, пока агент обдумывает следующий шаг
Захватывает все соответствующие события, возникающие в результате действий, включая выбор файлов, загрузки, запросы разрешений и диалоговые окна
Возвращает эти события вместе со скриншотом замороженной страницы, чтобы агент мог целостно анализировать состояние браузера с полным контекстом

Производительность и разработка

ABP достиг 90,53% на тесте Online Mind2Web Benchmark, удерживая первое место в течение двух дней, пока GPT-5.4 не превзошёл его с результатом 92,8%. Разработчик использовал Claude Opus-4.5 для работы над проектом по вечерам и выходным, завершив его за два месяца.

Практическое применение

Согласно источнику, ABP особенно хорошо справляется с:

Заполнением форм
Онлайн-покупками
Загрузкой файлов
Выгрузкой файлов
Заказом еды на вынос
Обратной разработкой недокументированных API веб-сайтов

Начало работы

Чтобы добавить ABP в Claude Code:

claude mcp add browser -- npx -y agent-browser-protocol --mcp

После этого вы можете давать Claude команды, например:

Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.

Ресурсы

Репозиторий на GitHub: https://github.com/theredsix/agent-browser-protocol

Результаты тестирования: https://github.com/theredsix/abp-online-mind2web-results

📖 Read the full source: r/ClaudeAI

Протокол Agent Browser: открытый форк Chrome для ИИ-агентов достигает 90% на бенчмарке Mind2Web

Протокол агентского браузера: браузер, созданный для ИИ-агентов

Ключевой технический подход

Производительность и разработка

Практическое применение

Начало работы

Ресурсы

👀 Смотрите также

OMAR: Открытая TUI для иерархического управления сотнями AI-агентов кодирования

TechDebtMCP v2.0.0: MCP-сервер для анализа технического долга на 14 языках

Loom: Локальный исполнительный механизм для сложных задач искусственного интеллекта

Расширение Microsoft DebugMCP для VS Code предоставляет AI-агентам возможности отладки.