モバイルハーネス: Claudeエージェント向けモバイルアプリにブラウザ使用スキルをもたらす

Mobile Harnessは、ブラウザ操作のアプローチをモバイルアプリに応用した新しいオープンソースプロジェクトです。ClaudeなどのAIエージェントがReddit、Instagram、TikTokといったモバイルアプリと対話するための再利用可能なスキルを提供します。スキルの例としては、ユーザープロフィールの検索と公開データの抽出、最新投稿の取得、スクロールとコンテンツの抽出、オンボーディングフローの実行などがあります。
内部ではMobAIを実行レイヤーとして使用しています。MobAIはクローズドソースですが、モバイルデバイスを制御するためのプロトコル/インターフェース(画面の観察、UIとの対話、アクションの実行など)を提供します。Mobile Harnessはその上に構築され、エージェントが呼び出せる再利用可能なアプリレベルスキルを実現します。実際のデバイス、エミュレータ、シミュレータで動作し、無料の日次クォータがあるため、支払いなしで試すことができます。
リポジトリはこちら:https://github.com/MobAI-App/mobile-harness。
📖 Read the full source: r/ClaudeAI
👀 See Also

Loom: 複雑なAIタスクのためのローカル実行ハーネス
Loomは、複雑なタスクを管理するために設計されたオープンソースのローカル実行ハーネスです。約50のツール、繰り返し可能なワークフローのためのカスタムパッケージプラグインシステム、CLIとMCPサーバーインターフェースを備えた構造化されたプロセスを提供します。

ベンチマーク:M5 Max MacBook ProでQwen3-Coder-Next 8ビットを実行するMLXとOllamaの比較
M5 Max MacBook Pro(128GB RAM)上で8ビット量子化されたQwen3-Coder-Nextを実行するMLXとOllamaのバックエンドを比較したベンチマークでは、MLXが約72トークン/秒を達成し、さまざまなコーディングタスクにおいてOllamaのスループットの約2倍の性能を示しました。

AMD R9700上でVS Code Copilotを使用してQwen3.6-35B-A3B-UD-Q5_K_XLをローカル実行
あるユーザーが、Qwen3.6-35B-A3B-UD-Q5_K_XL を AMD R9700 1枚と Vulkan を使って llama.cpp で動作させ、最小限のプロンプトで完全なウェブサイトと Playwright テストを生成した事例をシェアしています。

GPT-5.5 Codex 対 Claude Opus 4.7:実世界のコーディングエージェントベンチマーク
ある開発者が、GPT-5.5 CodexとClaude Opus 4.7を、PRトリアージボットとリアルタイムコードレビューUIという2つの実タスクで比較した。Claudeはクリーンでエラーゼロを達成。Codexは18%安かったが、修正パスが必要だった。