OpenClawデベロッパーがUberとレストラン予約自動化でAIエージェントのブレークスルーを達成

OpenClawの開発者がブラウザ自動化において大きな進展を遂げ、従来AIエージェントが実際のウェブサイトと対話するのを妨げていた制限を超えました。開発者は、スクリプト化されたデモではなく、実際のサイト上で複雑なタスクを自律的に完了できるエージェントの作成に成功しました。
現在実際に機能していること
開発者は、2つの主要プラットフォームで完全なフローの成功を達成しました:
- Uber:エージェントはアプリを開き、乗車地と目的地を入力し、乗車タイプを選択し、確認画面まで進みます
- レストラン予約:エージェントはレストランを見つけ、予約フォームに入力し、予約を確定します
これらはスクリプト化されたデモではありません。エージェントは実際のウェブサイトをナビゲートし、動的要素を処理し、ボット検知システムを回避することに成功しています。
現在の技術スタック
機能するソリューションは、いくつかの統合されたコンポーネントで構成されています:
- 永続的なプロファイルとフィンガープリント機能を備えたステルスブラウザ
- 住宅用プロキシルーティング
- CAPTCHA解決の統合
開発者は、これは機能するもののまだ完成品ではなく、現在は「手動設定が必要な、複数の部品を仮止めした状態」であると述べています。
開発の方向性とコミュニティからの意見
開発者はこの概念実証を、あらゆるOpenClawユーザーが利用できるものに変えたいと考えていますが、「理想的な」バージョンを構築する前にコミュニティからのフィードバックを求めています。長期的なビジョンは、「スキルをインストールすれば、エージェントは保存されたセッションを含む完全なブラウザ環境を取得し、ウェブ上で自律的に行動できるようになる」というものです。
当面の開発に向けて、開発者はコミュニティに具体的な質問を投げかけています:
- ブラウザの制限により、どのような具体的な自動化タスクが失敗しましたか?
- あなたのエージェントに利用させたいサイトやサービスは何ですか?(Uber、Airbnb、LinkedIn、政府ポータル、フードデリバリーなど)
- 現時点で最も有用な形式は何ですか?
開発者は、コミュニティの検討のためにいくつかの形式オプションを提示しています:
- a) エージェントにステルスブラウザを提供するOpenClawスキル
- b) VPS上で実行し、エージェントに接続するスタンドアロンツール
- c) アンチ検知、セッション管理、フィンガープリント機能をすぐに使えるデスクトップブラウザアプリ
- d) 自分で部品を接続するためのセットアップガイドのみ
- e) その他のもの
開発者はまた、ユーザーがVPS要件を受け入れるか、ローカルマシン機能を必要とするかについても尋ねています。
📖 Read the full source: r/openclaw
👀 See Also

WordPress.com MCP統合により、Claudeに書き込み機能が追加されました
WordPress.comのMCP統合が書き込み操作をサポートするようになり、ClaudeがWordPress.comサイト上で直接投稿を下書きしたり、ページを作成したり、コメントを管理したり、画像の代替テキストを修正したり、コンテンツカテゴリを再構築したりできるようになりました。コンテンツを生成する前に、Claudeはサイトのテーマを読み取り、色、フォント、ブロックパターンなどのデザイン要素を理解します。

ハイブリッド検索とRRFにより、純粋なベクトル検索を超えるAIメモリシステムが向上します。
PostgreSQLとpgvectorを使用したオープンソースのAIメモリシステムは、完全一致の検索において純粋なベクトル検索が不十分であることを発見し、全文検索を追加し、k=60の相互順位融合(RRF)で結果を統合しました。さらに、トークナイザーによるクエリ拡張も行っています。

Claude Codeプロトコルファイルは、繰り返しの質問を削減します。
開発者が、Claude Codeが有用な作業を開始する前に繰り返し質問する傾向に対処するプロトコルファイルを共有しました。ソースによると、典型的なClaude Codeのセッションは「どのフレームワークですか?」「エラーを見せてもらえますか?」「これが私の計画です、進めてもいいですか?」という3つの標準的な質問から始まっていました。この質問パターンは、単純なタスクでもかなりの時間を消費し、例として示されたnullチェックの実装だけで12回のメッセージと8分が費やされていたと報告されています。

depct: MCPサーバーはClaudeにライブランタイム分析とドキュメンテーションを提供します
depctは、Node.jsアプリケーションを計装してランタイムデータを収集し、Claudeがコーディング前にアクセスできる信頼度レベル付きの構造化ドキュメントを生成するMCPサーバーです。このツールは、Claudeが変更を加えた後にドキュメントを自動的に更新します。