oMLXは、Apple Silicon向けにSSD KVキャッシングを導入し、OpenClawの応答時間を30〜90秒から5秒に短縮しました。

✍️ OpenClawRadar📅 公開日: March 7, 2026🔗 Source
oMLXは、Apple Silicon向けにSSD KVキャッシングを導入し、OpenClawの応答時間を30〜90秒から5秒に短縮しました。
Ad

oMLXが解決する課題

OpenClawをローカルで実行する場合、通常は同じ巨大なシステムプロンプト(ツール、スキル、ワークスペースコンテキストをカバーする20〜30kトークン)をすべてのリクエストで送信する必要があります。OllamaやLM StudioはKV状態をキャッシュしますが、セッション中にコンテキストがシフトするとキャッシュ全体を無効化し、最初から再計算するため、応答時間が30〜90秒かかってしまいます。

oMLXは、KVキャッシュブロックをsafetensors形式でSSDに永続化することでこの問題を解決します。以前に見たプレフィックスが戻ってきた場合、再計算する代わりにディスクから復元され、リクエスト間やサーバー再起動をまたいで機能します。OpenClawのシステムプロンプトはほとんど静的(タイムスタンプと実行時メタデータのみが変化)であるため、SSDキャッシュにより変更された部分のみが再計算されます。

パフォーマンスベンチマーク

M3 Ultra 512GBでのQwen3.5-122B-A10B-4bitによるテスト結果:

  • 単一リクエストベンチマーク:
    • 1kコンテキスト: 768 tok/s プロンプト処理、56.6 tok/s 生成、65.5 GB ピークメモリ
    • 8kコンテキスト: 940 tok/s プロンプト処理、51.4 tok/s 生成、69.3 GB ピークメモリ
    • 32kコンテキスト: 764 tok/s プロンプト処理、42.4 tok/s 生成、73.4 GB ピークメモリ
  • 連続バッチ処理(pp1024/tg128):
    • 1xバッチ: 56.6 tok/s、1.00x 高速化
    • 2xバッチ: 92.1 tok/s、1.63x 高速化
    • 4xバッチ: 135.1 tok/s、2.39x 高速化
    • 8xバッチ: 190.2 tok/s、3.36x 高速化
Ad

OpenClawでのセットアップ

  • リリースからDMGをダウンロードし、Applicationsにドラッグ
  • モデルディレクトリを指定(LM Studioモデルを再利用、再ダウンロード不要)
  • openclaw.jsonにカスタムプロバイダーとしてoMLXを追加
  • Webダッシュボードが正確な設定を生成 - ターミナル不要

追加機能

  • マルチモデル提供: LLM + 埋め込み + ランキングモデルを同時に実行
  • 主要な形式(JSON、Qwen、Gemma、GLM) + MCPのツール呼び出し対応
  • ツール結果トリミング - 過大なツール出力を切り詰め
  • OpenAI + Anthropic /v1/messages ドロップイン互換性
  • ネイティブmacOSメニューバーアプリ(Electron不使用)
  • Apache 2.0ライセンス、100%オープンソース

📖 全文を読む: r/openclaw

Ad

👀 See Also

MCPサーバーは、AIエージェントを既存のChromeセッションに接続し、クッキーと認証情報を利用可能にします。
Tools

MCPサーバーは、AIエージェントを既存のChromeセッションに接続し、クッキーと認証情報を利用可能にします。

@playwright-repl/mcpは、Dramaturg拡張機能を介してAIエージェントを既存のChromeブラウザに接続するMCPサーバーで、クッキーや認証情報を含む実際のブラウザセッションへのアクセスを提供します。Playwright JavaScriptの完全なサポート、アサーション機能を備え、Claude Desktop、Claude Code、Cursor、または任意のMCPクライアントで動作します。

OpenClawRadar
Ghostbar: 画面共有から隠れる約5MBのネイティブmacOS Swift AIクライアント
Tools

Ghostbar: 画面共有から隠れる約5MBのネイティブmacOS Swift AIクライアント

GhostbarはネイティブSwift製のmacOSメニューバーAIクライアント(約5MB)で、window.sharingType = .noneを使用して画面録画ツールから見えなくなります。Ollama、vLLM、llama.cpp、およびOpenAI互換のバックエンドで動作します。

OpenClawRadar
memv: AIエージェントのためのオープンソースメモリシステム
Tools

memv: AIエージェントのためのオープンソースメモリシステム

memvは、AIエージェント向けに設計されたオープンソースのメモリシステムで、インタラクションから予期しない情報のみを保存することで、ノイズと冗長性を削減します。

OpenClawRadar
開発者が、トピックやYouTubeリンクからポッドキャストを作成するローカルAI研究エージェントを構築しました。
Tools

開発者が、トピックやYouTubeリンクからポッドキャストを作成するローカルAI研究エージェントを構築しました。

ある開発者が、トピックやYouTubeリンクを入力として受け取り、深掘りレポート、会話形式のポッドキャストスクリプト、音声を生成する完全ローカルのAIエージェントを構築しました。このシステムは、動的に調査を行い、洞察を抽出し、要約を洗練させ、自然な対話を作成します。

OpenClawRadar