ブラウザハーネス: LLMに生のCDPアクセスを提供し、ブラウザタスクを自己修正させる

Browser Harnessは、CDP Websocketを介してChromeに直接接続することで、LLMにブラウザタスクを完了する完全な自由を与える自己修復型ハーネスです(約592行のPython)。Playwright MCPやagent-browserのようにChromeを事前定義された関数でラップする代わりに、Websocketを保持する薄いデーモン、基本的なヘルパー、そしてSKILL.mdファイルを提供し、エージェントが必要に応じて独自のツールを作成できるようにします。
仕組み
核となる概念は次のとおりです:
- CDP Websocketを生かし続けるデーモン
helpers.py内の非常に基本的なツール(約195行)- 使用方法を説明する
SKILL.md
LLMが存在しない関数を必要とする場合、helpers.pyを編集して追加します。作者によると、エージェントがファイルをアップロードしようとしてupload_file()関数が見つからず、DOM.setFileInputFilesを使って自分で作成し、続行したケースがあり、これはgit diffでのみ確認できました。
他のアプローチとの比較
他のツール(Playwright MCP、browser-use CLI、agent-browser、Chrome DevTools MCP)は、Chromeを事前定義された関数でラップしています。それらの最悪の障害モードは、click()が成功を返しても何も起こらないという沈黙の失敗です。Browser Harnessは、LLMに完全なコンテキストと自己修正の自由を与えることを目指しています。
セットアップとインストール
Claude CodeまたはCodexで次のコードを貼り付けてインストールします:
Set up https://github.com/browser-use/browser-harness for me.
エージェントはinstall.mdを読んでブートストラップし、その後SKILL.mdを通常の使用法として読み、常にhelpers.pyで利用可能な関数を確認します。
実例
- Stockfishチェスエンジンをプレイ
- テトリスで世界記録を達成
- JavaScriptでハートを描画
貢献について
貢献を歓迎します:LinkedIn、Amazonなどのサイト向けにdomain-skills/以下にドメインスキルを追加してください。スキルはハーネスによって生成され、手動で作成されるものではありません。バグ修正、ドキュメント、ヘルパーの改善も受け付けています。
ライセンス:MIT。
📖 全文を読む: HN LLM Tools
👀 See Also

ルクズ:20万行のC++グラフデータベースを体系的テストでRustに移植
Rukuzuプロジェクトは、20万行のC++で書かれた埋め込みグラフデータベースkuzuをRustに移植するワークフローを説明しています。Claude Codeカスタムコマンドを使用して両バージョンを同時に維持し、2,700以上のテストを通じて正確性を検証します。

RTX 5060 Ti 16GB ローカルLLMベンチマーク:コーディングでは30Bモデルが依然としてリード
RTX 5060 Ti 16GBでのベンチマークによると、Unsloth Qwen3-Coder-30B UD-Q3_K_XLはUbuntu上で76.3 tok/s、品質スコア8.14を達成し、推奨されるデフォルトのコーディングモデルとなっています。Unsloth Qwen3.5-35B UD-Q2_K_XLは80.1 tok/sを記録しましたが、品質スコアは低めでした。

FOMOEにより、2,100ドルのデスクトップハードウェアで397B Qwen3.5モデルの推論が可能に
FOMOE(Fast Opportunistic Mixture of Experts)は、Q4_K_M量子化を使用し、2台の500ドルGPU、32GB RAM、NVMeドライブを備えたコンシューマーハードウェアで、Qwen3.5の3970億パラメータのフラッグシップモデルを毎秒5〜9トークンの速度で実行可能にします。

SkyClaw v2.2 Rust AI エージェントランタイム、OpenAI OAuthとカスタムツール作成機能を追加
SkyClaw v2.2は、ChatGPT Plus/Proサブスクリプションを使用したOpenAI OAuth認証、エージェントが実行時に独自のbash/python/nodeツールを作成するカスタムツール作成機能、バックグラウンド操作のためのデーモンモードを導入しています。Rustベースのランタイムは、31msのコールドスタート、15MBのアイドルRAM、9.3MBのバイナリサイズでベンチマークされています。