ブラウザCLI:AIコーディングエージェント向けのトークン効率の良いブラウザ自動化ツール

Browser CLIの機能
Browser CLIは、AIコーディングエージェントにおけるトークンオーバーヘッドに対処するために構築されたブラウザ自動化ツールです。開発者は、Playwright MCPプロトコルのオーバーヘッドにより、ブラウザ検証がセッションごとに約30,000トークンを消費していることに気づきました。各browser_navigate + browser_snapshotコールは、JSONスキーマフレーミングで約1,500トークンのコストがかかっていました。
解決策は、Bashコマンドを介して操作する永続的なヘッドレスChromiumデーモンです。内部では同じPlaywright ARIAスナップショット技術を使用していますが、約1,500トークンではなく、コールあたり約50〜100トークンで実現します。
コマンドと使用方法
利用可能なコマンドには以下が含まれます:
browser-cli goto https://example.com- URLに移動browser-cli snapshot -i- @e参照付きARIAツリーbrowser-cli click @e3- 参照によるクリックbrowser-cli fill @e5 "hello"- 入力フィールドへの入力browser-cli css @e3 font-size- 計算済みCSS値の取得browser-cli inspect @e3- 完全なボックスモデル+スタイルbrowser-cli screenshot /tmp/page.png- スクリーンショットbrowser-cli snapshot -D- 差分:前回のスナップショットからの変更点browser-cli responsive /tmp- モバイル/タブレット/デスクトップでのスクリーンショット
サーバーは最初のコールで自動起動し(約3秒)、その後はコールあたり約100〜200msで応答します。30分間生存し、コマンド間でクッキー、タブ、状態を保持します。
トークン節約効果
トークン比較:
- Playwright MCP:コールあたり約1,500トークン、20コールで約30,000トークン
- Browser CLI:コールあたり約75トークン、20コールで約1,500トークン
これはブラウザ検証で95%の節約となります。セッションごとに複数のタスクを実行する自動化パイプラインでは、この効果が急速に累積します。
Playwright MCPを超える機能
- CSS検査 -
css @e3 paddingは計算済み値を返します。inspect @e3は完全なボックスモデル+16の主要スタイルをJSONで提供します。 - ライブスタイル変更 -
style @e3 color redとstyle --undo。ソースコードに触れずにCSSをデバッグ。 - スナップショット差分比較 -
snapshot -Dは前後のARIAツリーを比較します。 - レスポンシブプリセット -
responsive /tmpはモバイル、タブレット、デスクトップのスクリーンショットを1コマンドで撮影します。 - 認証プロファイル -
handoffは手動SSO/MFAログイン用に可視Chromeを開き、resumeでヘッドレスに戻ります。auth-save adminはセッションを暗号化(AES-256)。次回はgoto-auth https://app.com/dashboard --profile adminでログイン不要。 - コマンドバッチ処理 -
chain [["goto","url"],["snapshot","-i"],["console"]]は複数コマンドを1コールで実行します。
技術的実装
アーキテクチャ:AIエージェント → Bash → CLIクライアント(bin/browse.mjs) → HTTP POST(localhost) → サーバー(src/server.mjs) → Playwright API → Chromium(ヘッドレス)。
純粋なNode.js。Playwrightが唯一の依存関係。Bun、Rust、MCPオーバーヘッドなし。
Claude Code統合
グローバルインストール:
npm install -g @tuandm/browser-cli.claude/settings.jsonに追加:
{
"permissions": {
"allow": ["Bash(browser-cli*)"]
}
}.claude/rules/browser-cli.mdにルールを追加し、ClaudeにPlaywright MCPの代わりにBrowser CLIを使用するよう指示。開発者は5つの評価シナリオを実行し、ルールが読み込まれるとClaudeは毎回正しいコマンドを選択しました。
将来のマーケットプレイス配布用に、Claude Codeプラグイン(plugin.json付属)としても提供されています。
インスピレーションと技術
Garry Tanのgstackに触発されました。これはAIエージェント向けの永続的Chromium CLIアプローチを開拓しました。中核的な洞察は、ブラウザ自動化においてBashコマンドがMCPよりも劇的にトークン効率が良いことでした。基盤技術はMicrosoftのPlaywrightです。
📖 完全なソースを読む: r/ClaudeAI
👀 See Also

MuninnDBは、ボールト分離によるLLMメモリ統合のためのドリームエンジンを追加しました。
Goベースの認知メモリデータベースであるMuninnDBは、セッション間で重複排除閾値と意味的レビューを用いたLLM駆動のメモリ統合を行う「Dream Engine」を新たに搭載しました。このシステムは、データ分離のためのボールト信頼階層を特徴とし、Ollamaと共にローカルで動作します。

Claude Codeのスラッシュコマンドの再構築は、問題解決に認知科学の手法を適用します
開発者がClaude Code用の/reframeスラッシュコマンドを作成し、認知科学の手法である距離-関与振動を実装しました。このアプローチは3つのオープンウェイトLLMで50の問題をテストし、他の手法を一貫して上回りました。

オープンソースダッシュボードが明らかにするClaudeコードの実際のコンピューティングコスト
ある開発者がClaude Codeのレート制限の計算式をリバースエンジニアリングし、リアルタイムの使用率パーセンテージ、実際のドルコスト、バーンレート、ピーク時間、およびどのスキル/フックが発動しているかを表示するローカルダッシュボードを構築しました。このツールにより、月額100ドルのプランが1か月で13,286ドル相当のAPIコンピュートを消費していたことが明らかになりました。

Queuelo: LLMエージェント向け軽量承認API
Queueloは、LLMエージェントが不可逆的なアクションを実行する前に一時停止できるシンプルなAPIレイヤーです。エージェントがアクションリクエストをPOSTすると、承認または拒否の通知が届き、エージェントはウェブフックを通じて回答を受け取ります。