PageAgent:Ollamaサポートを備えたWebページ内で動作するブラウザAIエージェント

PageAgentの機能
PageAgentは、PlaywrightやSeleniumのようにブラウザ外部から制御するほとんどのフレームワークとは異なり、Webページ自体の中でJavaScriptライブラリとして実行されるブラウザAIエージェントフレームワークです。
主な技術的特徴
エージェントはライブDOMをテキストとして読み取るため、スクリーンショットや視覚モデルが不要となり、より高速でトークン効率が良くなります。
Ollamaを含むあらゆるOpenAI互換エンドポイントで動作します。ローカルモデルと組み合わせることで、バックエンドやクラウドを必要とせず、すべてがユーザーのマシン上で完結します。LLM呼び出しはブラウザからlocalhostに直接行われます。
コード例
const agent = new PageAgent({
model: 'qwen3.5:27b',
baseURL: 'http://localhost:11434/v1',
})
await agent.execute('先週の金曜日の経費報告書を記入してください')追加機能
- エージェントの思考過程を確認し、いつでも停止・修正できるヒューマン・イン・ザ・ループパネル
- マルチタブタスク用のオプショナルブラウザ拡張機能
- MITライセンス
プロジェクトはGitHubのalibaba/page-agentで公開されています。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

CC-Ledger: ローカルSQLiteを使用してClaude Codeのコストをセッションごと・PRごとに追跡
CC-LedgerはClaude Codeにフックして各ターンをローカルのSQLiteに記録するRustバイナリです。暴走セッションをリアルタイムで検出し、APIキー不要でPRごとのコストを把握できます。macOSメニューバー、Webダッシュボード、CLIを備えています。

macOSのsandbox-execによる安全なアプリケーション実行の探求
sandbox-execは、アプリケーションを制限された環境で実行できるmacOSのコマンドラインユーティリティです。カスタムサンドボックスプロファイルを使用して活用する方法を学びましょう。

OpenClaw PARA組織スキルは、ファイルを自動的にプロジェクト、エリア、リソース、アーカイブに仕分けします。
開発者が、ファイルを整理するためのPARAメソッド(プロジェクト、エリア、リソース、アーカイブ)を強制するOpenClawスキルを作成しました。これにより、すべてのコンテンツをルートディレクトリにダンプする代わりに、自動的にソートされます。

ファントム:クロードのエージェントSDKで構築された持続型AIエージェント
Phantomは、ClaudeのAgent SDK(Opus 4.6)を永続的なベクターメモリ、自己進化エンジン、MCPサーバーインターフェースでラップしたオープンソースのBun/TypeScriptプロセスです。独自のVMまたはDocker Compose上で継続的に動作し、Slackを介して通信します。