CLI del Navegador: Una Herramienta de Automatización de Navegadores Eficiente en Tokens para Agentes de IA de Programación

Qué hace Browser CLI
Browser CLI es una herramienta de automatización de navegadores creada para abordar la sobrecarga de tokens en agentes de codificación con IA. El creador notó que la verificación del navegador consumía ~30,000 tokens por sesión debido a la sobrecarga del protocolo Playwright MCP, donde cada llamada de browser_navigate + browser_snapshot costaba ~1,500 tokens en el marco del esquema JSON.
La solución es un demonio persistente de Chromium sin interfaz con el que interactúas mediante comandos Bash. Utiliza la misma tecnología de instantánea ARIA de Playwright internamente, pero logra ~50-100 tokens por llamada en lugar de ~1,500.
Comandos y Uso
Los comandos disponibles incluyen:
browser-cli goto https://example.com- Navegar a la URLbrowser-cli snapshot -i- Árbol ARIA con referencias @ebrowser-cli click @e3- Hacer clic por referenciabrowser-cli fill @e5 "hello"- Rellenar campo de entradabrowser-cli css @e3 font-size- Obtener valor CSS calculadobrowser-cli inspect @e3- Modelo de caja completo + estilosbrowser-cli screenshot /tmp/page.png- Captura de pantallabrowser-cli snapshot -D- Diferencia: qué cambió desde la última instantáneabrowser-cli responsive /tmp- Capturas de pantalla en móvil/tableta/escritorio
El servidor se inicia automáticamente en la primera llamada (~3s), luego las llamadas posteriores son de ~100-200ms. Permanece activo durante 30 minutos, conservando cookies, pestañas y estado entre comandos.
Ahorro de Tokens
Comparación de tokens:
- Playwright MCP: ~1,500 tokens por llamada, ~30,000 tokens por 20 llamadas
- Browser CLI: ~75 tokens por llamada, ~1,500 tokens por 20 llamadas
Eso es un ahorro del 95% en verificación del navegador. Para flujos automatizados que realizan múltiples tareas por sesión, esto se acumula rápidamente.
Características más allá de Playwright MCP
- Inspección CSS -
css @e3 paddingdevuelve valores calculados.inspect @e3proporciona el modelo de caja completo + 16 estilos clave como JSON. - Mutación de estilos en vivo -
style @e3 color redconstyle --undo. Depura CSS sin tocar el código fuente. - Detección de diferencias en instantáneas -
snapshot -Dcompara árboles ARIA antes/después. - Preajustes responsivos -
responsive /tmptoma capturas de pantalla móvil + tableta + escritorio en un solo comando. - Perfiles de autenticación -
handoffabre un Chrome visible para inicio de sesión manual SSO/MFA,resumevuelve al modo sin interfaz,auth-save admincifra la sesión (AES-256). La próxima vez:goto-auth https://app.com/dashboard --profile admin— sin necesidad de iniciar sesión. - Procesamiento por lotes de comandos -
chain [["goto","url"],["snapshot","-i"],["console"]]ejecuta múltiples comandos en una sola llamada.
Implementación Técnica
Arquitectura: Agente de IA → Bash → Cliente CLI (bin/browse.mjs) → HTTP POST (localhost) → Servidor (src/server.mjs) → API de Playwright → Chromium (sin interfaz).
Puro Node.js. Playwright es la única dependencia. Sin Bun, sin Rust, sin sobrecarga MCP.
Integración con Claude Code
Instalar globalmente:
npm install -g @tuandm/browser-cliAgregar a .claude/settings.json:
{
"permissions": {
"allow": ["Bash(browser-cli*)"]
}
}Agregar una regla en .claude/rules/browser-cli.md indicando a Claude que use Browser CLI en lugar de Playwright MCP. El creador ejecutó 5 escenarios de evaluación y Claude eligió el comando correcto cada vez con la regla cargada.
También se distribuye como un complemento de Claude Code (plugin.json incluido) para distribución futura en el mercado.
Inspiración y Tecnología
Inspirado por gstack de Garry Tan, que fue pionero en el enfoque de CLI persistente de Chromium para agentes de IA. La idea central fue que los comandos Bash son dramáticamente más eficientes en tokens que MCP para automatización de navegadores. La tecnología subyacente es Playwright de Microsoft.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

InsForge: Backend de Postgres Autohospedado con Integración MCP para Agentes de Codificación de IA
InsForge es una alternativa de backend de código abierto y autoalojada a Supabase que se conecta a Claude Code a través de MCP, permitiendo que los agentes de IA vean el esquema, las políticas y el estado del servicio. Incluye PostgreSQL 16.4, PostgREST, Deno Runtime, autenticación, almacenamiento y funciones de borde.

hipEngine: Inferencia Rápida Nativa de Qwen 3.6 para RDNA3 (Strix Halo, 7900 XTX)
hipEngine es un nuevo motor de inferencia de código abierto (AGPLv3) nativo de ROCm para Qwen 3.6 MoE en GPUs RDNA3. Los benchmarks muestran prefill de hasta 2718 tok/s en 7900 XTX, competitivo con llama.cpp, y caché KV INT8 que permite contexto completo de 256K en menos de 24 GB.

Escudo de Razonamiento: Detección de Bucles a Nivel de Proxy para Inferencia Local de LLM
Un guardia a nivel de proxy que detecta y recupera bucles de razonamiento de LLM mediante comprobaciones deterministas de flujo: límites de tokens, repetición de n-gramas y huellas de oraciones, sin modificaciones del modelo.

Claude Code v2.1.142: Nuevas banderas de agentes Claude, Opus 4.7 por defecto y correcciones de errores
Claude Code v2.1.142 añade ocho nuevas opciones para configurar sesiones en segundo plano, cambia el modo rápido a Opus 4.7 por defecto y corrige más de una docena de errores, incluido el tiempo de espera de la herramienta MCP, problemas del daemon de suspensión/activación en macOS y bloqueos en unidades de red de Windows.