Протокол Agent Browser: открытый форк Chrome для ИИ-агентов достигает 90% на бенчмарке Mind2Web

Протокол агентского браузера: браузер, созданный для ИИ-агентов
Протокол агентского браузера (ABP) — это открытая форк-версия браузера Chrome, специально разработанная для ИИ-агентов. Проект был создан как вызов — построить браузер, ориентированный на агентов, и занять первое место в Online Mind2Web Benchmark.
Ключевой технический подход
Основная идея ABP заключается в том, что ИИ-агенты отлично справляются с пошаговым чатом, но испытывают трудности с принятием решений в непрерывном времени. Чтобы максимизировать производительность больших языковых моделей (LLM) на задачах в браузере, ABP преобразует веб-сёрфинг в мультимодальный чат, выполняя следующие действия:
- Замораживает JavaScript и время после каждого действия, так что веб-страница остаётся замороженной, пока агент обдумывает следующий шаг
- Захватывает все соответствующие события, возникающие в результате действий, включая выбор файлов, загрузки, запросы разрешений и диалоговые окна
- Возвращает эти события вместе со скриншотом замороженной страницы, чтобы агент мог целостно анализировать состояние браузера с полным контекстом
Производительность и разработка
ABP достиг 90,53% на тесте Online Mind2Web Benchmark, удерживая первое место в течение двух дней, пока GPT-5.4 не превзошёл его с результатом 92,8%. Разработчик использовал Claude Opus-4.5 для работы над проектом по вечерам и выходным, завершив его за два месяца.
Практическое применение
Согласно источнику, ABP особенно хорошо справляется с:
- Заполнением форм
- Онлайн-покупками
- Загрузкой файлов
- Выгрузкой файлов
- Заказом еды на вынос
- Обратной разработкой недокументированных API веб-сайтов
Начало работы
Чтобы добавить ABP в Claude Code:
claude mcp add browser -- npx -y agent-browser-protocol --mcpПосле этого вы можете давать Claude команды, например:
Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.Ресурсы
Репозиторий на GitHub: https://github.com/theredsix/agent-browser-protocol
Результаты тестирования: https://github.com/theredsix/abp-online-mind2web-results
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

OMAR: Открытая TUI для иерархического управления сотнями AI-агентов кодирования
OMAR — это терминальная панель управления, которая позволяет управлять роями кодирующих агентов (Claude Code, Codex, Cursor, Opencode) в иерархических организациях. Основан на tmux. Поддерживает иерархии агентов, управляющих агентами, гетерогенные бэкенды и интеграцию со Slack.

TechDebtMCP v2.0.0: MCP-сервер для анализа технического долга на 14 языках
TechDebtMCP v2.0.0 — это MCP-сервер, который подключает Claude к вашей кодовой базе для анализа технического долга. После подключения вы можете задавать Claude вопросы о техническом долге, проблемах безопасности и качестве кода.

Loom: Локальный исполнительный механизм для сложных задач искусственного интеллекта
Loom — это открытый локальный исполнительный фреймворк, предназначенный для управления сложными задачами. Он предоставляет структурированный процесс с примерно 50 инструментами, системой плагинов пользовательских пакетов для повторяющихся рабочих процессов, а также интерфейсы CLI и MCP-сервера.

Расширение Microsoft DebugMCP для VS Code предоставляет AI-агентам возможности отладки.
Microsoft DebugMCP — это расширение для VS Code, которое предоставляет полный доступ к отладчику VS Code для ИИ-агентов программирования через Model Context Protocol (MCP), позволяя им устанавливать точки останова, пошагово выполнять код, проверять переменные и вычислять выражения.