Navigateur CLI : Un outil d'automatisation de navigation économe en tokens pour les agents d'IA de codage

Ce que fait Browser CLI
Browser CLI est un outil d'automatisation de navigateur conçu pour réduire la surcharge de tokens dans les agents d'IA de codage. Le créateur a remarqué que la vérification du navigateur consommait environ 30 000 tokens par session à cause de la surcharge du protocole Playwright MCP, chaque appel browser_navigate + browser_snapshot coûtant environ 1 500 tokens dans l'encadrement du schéma JSON.
La solution est un démon Chromium sans tête persistant avec lequel vous interagissez via des commandes Bash. Il utilise la même technologie de capture ARIA de Playwright en arrière-plan, mais atteint environ 50-100 tokens par appel au lieu d'environ 1 500.
Commandes et utilisation
Les commandes disponibles incluent :
browser-cli goto https://example.com- Naviguer vers l'URLbrowser-cli snapshot -i- Arbre ARIA avec références @ebrowser-cli click @e3- Cliquer par référencebrowser-cli fill @e5 "hello"- Remplir un champ de saisiebrowser-cli css @e3 font-size- Obtenir la valeur CSS calculéebrowser-cli inspect @e3- Modèle de boîte complet + stylesbrowser-cli screenshot /tmp/page.png- Capture d'écranbrowser-cli snapshot -D- Différence : ce qui a changé depuis la dernière capturebrowser-cli responsive /tmp- Captures d'écran pour mobile/tablette/bureau
Le serveur démarre automatiquement au premier appel (~3s), puis les appels suivants prennent ~100-200ms. Il reste actif pendant 30 minutes, préservant les cookies, les onglets et l'état entre les commandes.
Économies de tokens
Comparaison des tokens :
- Playwright MCP : ~1 500 tokens par appel, ~30 000 tokens pour 20 appels
- Browser CLI : ~75 tokens par appel, ~1 500 tokens pour 20 appels
Cela représente 95 % d'économies sur la vérification du navigateur. Pour les pipelines automatisés qui effectuent plusieurs tâches par session, cela s'accumule rapidement.
Fonctionnalités au-delà de Playwright MCP
- Inspection CSS -
css @e3 paddingrenvoie les valeurs calculées.inspect @e3donne le modèle de boîte complet + 16 styles clés en JSON. - Mutation de style en direct -
style @e3 color redavecstyle --undo. Déboguez le CSS sans toucher au code source. - Différenciation des captures -
snapshot -Dcompare les arbres ARIA avant/après. - Préréglages réactifs -
responsive /tmpprend des captures d'écran mobile + tablette + bureau en une seule commande. - Profils d'authentification -
handoffouvre un Chrome visible pour la connexion manuelle SSO/MFA,resumerevient au mode sans tête,auth-save adminchiffre la session (AES-256). La prochaine fois :goto-auth https://app.com/dashboard --profile admin— aucune connexion nécessaire. - Traitement par lots de commandes -
chain [["goto","url"],["snapshot","-i"],["console"]]exécute plusieurs commandes en un seul appel.
Implémentation technique
Architecture : Agent IA → Bash → Client CLI (bin/browse.mjs) → HTTP POST (localhost) → Serveur (src/server.mjs) → API Playwright → Chromium (sans tête).
Pure Node.js. Playwright est la seule dépendance. Pas de Bun, pas de Rust, pas de surcharge MCP.
Intégration avec Claude Code
Installez globalement :
npm install -g @tuandm/browser-cliAjoutez à .claude/settings.json :
{
"permissions": {
"allow": ["Bash(browser-cli*)"]
}
}Ajoutez une règle dans .claude/rules/browser-cli.md indiquant à Claude d'utiliser Browser CLI au lieu de Playwright MCP. Le créateur a exécuté 5 scénarios d'évaluation et Claude a choisi la bonne commande à chaque fois avec la règle chargée.
Il est également livré en tant que plugin Claude Code (plugin.json inclus) pour une distribution future sur le marketplace.
Inspiration et technologie
Inspiré par gstack de Garry Tan, qui a été le pionnier de l'approche CLI persistante de Chromium pour les agents d'IA. L'idée centrale était que les commandes Bash sont considérablement plus efficaces en tokens que MCP pour l'automatisation du navigateur. La technologie sous-jacente est Playwright de Microsoft.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Application macOS gratuite pour la barre de menu surveillant l'utilisation de Claude en temps réel
Un développeur a créé une application gratuite pour la barre de menu macOS afin de surveiller l'utilisation de Claude entièrement avec Claude Code et Opus. L'application affiche des barres d'utilisation pour les sessions de 5 heures et 7 jours, le pourcentage de remplissage de la fenêtre de contexte, et envoie des notifications lorsque les limites approchent.

yburn : Outil pour auditer et remplacer les tâches cron inutiles des agents IA
yburn est un outil Python qui audite les tâches cron des agents d'IA et remplace celles qui n'ont pas besoin de LLM par des scripts Python autonomes. Le créateur a constaté que 58 % des 98 tâches cron étaient des tâches purement mécaniques comme des vérifications de santé système et des sauvegardes git.

Bernstein : Un orchestrateur similaire à Kubernetes pour les agents d'IA de codage, avec vérification et politiques de modèle.
Bernstein est un orchestrateur pour agents d'IA de codage qui comprend la vérification indépendante des sorties d'agents, des contrôles de politique de modèles, 13 adaptateurs d'agents et une planification déterministe basée sur Python. Le projet compte plus de 5000 tests et des fonctionnalités comme des disjoncteurs, la détection d'anomalies de coût et la recherche de données personnelles.

Mímir : Un système de mémoire Python basé sur 21 mécanismes de neurosciences
Mímir est un système de mémoire Python pour agents IA qui implémente 21 mécanismes de sciences cognitives comme la mémoire flash et l'oubli induit par la récupération. Il utilise un index hybride BM25 + sémantique + date et montre des améliorations de référence, notamment une précision d'outil 13% supérieure sur Mem2ActBench par rapport à VividnessMem.