Protocolo de Navegador para Agentes: Fork de Chrome de código abierto para agentes de IA alcanza el 90% en el benchmark Mind2Web

Agent Browser Protocol: Un navegador construido para agentes de IA
Agent Browser Protocol (ABP) es un navegador fork de código abierto de Chrome específicamente diseñado para agentes de IA. El proyecto se creó como un desafío para construir un navegador centrado en agentes y alcanzar la puntuación más alta en el Online Mind2Web Benchmark.
Enfoque técnico clave
La idea principal detrás de ABP es que los agentes de IA sobresalen en el chat por turnos pero tienen dificultades con la toma de decisiones en tiempo continuo. Para maximizar el rendimiento de los LLM en tareas de navegador, ABP convierte la navegación web en chat multimodal mediante:
- Congelar JavaScript y el tiempo después de cada acción, de modo que la página web se congela mientras el agente piensa
- Capturar todos los eventos relevantes resultantes de las acciones, incluidos selectores de archivos, descargas, solicitudes de permisos y diálogos
- Devolver estos eventos junto con una captura de pantalla de la página congelada para que el agente pueda razonar de manera integral sobre el estado del navegador con contexto completo
Rendimiento y desarrollo
ABP logró un 90,53% en el Online Mind2Web Benchmark, manteniendo la puntuación más alta durante dos días hasta que GPT-5.4 lo superó con un 92,8%. El desarrollador utilizó Claude Opus-4.5 para trabajar en el proyecto durante las noches y los fines de semana, completándolo en dos meses.
Aplicaciones prácticas
Según la fuente, ABP sobresale en:
- Completar formularios
- Compras en línea
- Descargar archivos
- Subir archivos
- Pedir comida para llevar
- Ingeniería inversa de las API no documentadas de un sitio web
Cómo empezar
Para agregar ABP a Claude Code:
claude mcp add browser -- npx -y agent-browser-protocol --mcpLuego puedes darle comandos a Claude como:
Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.Recursos
Repositorio de GitHub: https://github.com/theredsix/agent-browser-protocol
Resultados del benchmark: https://github.com/theredsix/abp-online-mind2web-results
📖 Read the full source: r/ClaudeAI
👀 Ver también

Vibe Remote: Puente Móvil para Acceder al Código de Claude desde Cualquier Lugar
Vibe Remote es una aplicación móvil que proporciona acceso remoto a entornos de desarrollo de Claude Code desde un teléfono, permitiendo a los usuarios mantener sus configuraciones locales, historial de Git y estructura de archivos sin requerir Tailscale o configuraciones complejas de VPN.

Generador de Indicaciones Socráticas Construido como Artefacto React Dentro de Claude
Un desarrollador creó un generador de prompts socráticos como un artefacto React que se ejecuta dentro de Claude, con detección automática de la complejidad de entrada y generación de prompts de tres niveles con análisis de modos de fallo.

Compatibilidad oficial de Kotlin con VS Code ahora en alfa — Impulsado por el servidor de lenguaje de IntelliJ
JetBrains lanzó la extensión oficial de Kotlin para VS Code en Alpha, respaldada por el servidor de lenguaje Kotlin construido sobre la infraestructura de análisis de código de IntelliJ IDEA. Incluye autocompletado, diagnóstico, navegación, correcciones rápidas, formato e importación de proyectos.

ClaudeClaw: Plugin de Código Gratuito de Claude para Agentes de IA Persistentes en Plataformas de Mensajería
ClaudeClaw es un complemento gratuito y de código abierto con licencia MIT para Claude Code que ejecuta a Claude como un agente persistente en Slack, WhatsApp y Telegram. Requiere Node.js 20+, Claude Code y tu propia clave API de Anthropic, con aislamiento a nivel de sistema operativo mediante el sandbox-runtime de Anthropic.