エージェントブラウザプロトコル:AIエージェント向けオープンソースChromeフォークがMind2Webベンチマークで90%を達成

Agent Browser Protocol:AIエージェント向けに構築されたブラウザ
Agent Browser Protocol(ABP)は、AIエージェント向けに特別に設計されたオープンソースのChromeフォークブラウザです。このプロジェクトは、エージェント中心のブラウザを構築し、Online Mind2Webベンチマークで最高スコアを獲得する挑戦として作成されました。
主要な技術的アプローチ
ABPの背後にある主な洞察は、AIエージェントはターンベースのチャットには優れているものの、連続的な時間意思決定には苦戦するという点です。ブラウザタスクでのLLMパフォーマンスを最大化するため、ABPはウェブブラウジングをマルチモーダルチャットに変換します:
- 各アクション後にJavaScriptと時間を凍結し、エージェントが思考している間はウェブページが凍結された状態になります
- ファイルピッカー、ダウンロード、権限リクエスト、ダイアログなど、アクションから生じるすべての関連イベントをキャプチャします
- これらのイベントを凍結されたページのスクリーンショットと共に返し、エージェントが完全なコンテキストでブラウザの状態を包括的に推論できるようにします
パフォーマンスと開発
ABPはOnline Mind2Webベンチマークで90.53%を達成し、GPT-5.4が92.8%で上回るまで2日間トップスコアを保持しました。開発者は夜間と週末にClaude Opus-4.5を使用してプロジェクトに取り組み、2ヶ月以内に完成させました。
実用的な応用
ソースによると、ABPは以下に優れています:
- フォーム入力
- オンラインショッピング
- ファイルのダウンロード
- ファイルのアップロード
- テイクアウトの注文
- ウェブサイトの非公開APIのリバースエンジニアリング
はじめに
ABPをClaude Codeに追加するには:
claude mcp add browser -- npx -y agent-browser-protocol --mcpその後、Claudeに次のようなコマンドを与えることができます:
Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.リソース
GitHubリポジトリ:https://github.com/theredsix/agent-browser-protocol
ベンチマーク結果:https://github.com/theredsix/abp-online-mind2web-results
📖 Read the full source: r/ClaudeAI
👀 See Also

Claudeがpywikibotをインポートせずに3,000行のコードを書いた理由——AIエージェントが既存ライブラリを無視するケーススタディ
ある開発者がClaude Code(Opus 4.7)にFandomウィキのタイポ修正を依頼した。モデルは既存ライブラリをインポートせず、pywikibot、mwparserfromhell、RETFルールを再実装した約3,000行のPythonコードを書いた。この記事では、なぜそうなるのか、そして2分の検索でコードベースが1,259行に減った経緯を探る。

ClaudeDesk v4.2–4.3では、エージェントチームの可視化とリポジトリアトラスエンジンが導入されました。
ClaudeDesk v4.2–4.3は、Claude Code CLIのエージェントチームを管理するデスクトップGUIを提供し、Repository Atlas Engineによるセッション設定の最適化を行います。

MCPサーバーがClaudeをRoom EQ Wizardに接続し、スタジオ音響解析を実現
オープンソースのMCPサーバーにより、Claude AIがRoom EQ Wizardを制御できるようになり、スタジオモニターの自動キャリブレーションと室内音響解析が可能になります。このツールには、測定制御、信号生成、SPLメータリング、EQ管理のための27のMCPツールが含まれています。

シグネット:AIエージェントのためのオープンソース・ローカルファーストメモリ基盤
Signetは、AIエージェントのメモリ処理をエージェントループの外部に移すオープンソースのメモリ基盤です。トランスクリプトを保存し、セッションを構造化メモリに蒸留し、エンティティをグラフにリンクし、プロンプト開始前にコンテキストを注入します。