Mac MiniでのローカルLLMパフォーマンスベンチマーク:OpenClawとLM Studioを使用

Redditユーザーが、32GB RAM搭載のMac Miniでローカル大規模言語モデルを実行した具体的なパフォーマンスベンチマークを共有しました。この投稿は、このハードウェア構成における具体的なパフォーマンスデータの不足に対応しています。
技術的セットアップ詳細
ユーザーは以下の構成と結果を報告しました:
- ソフトウェアバージョン: OpenClaw 2026.3.8、LM Studio 0.4.6+1
- モデル: Unsloth gpt-oss-20b-Q4_K_S.gguf
- コンテキストサイズ: 26035
- パフォーマンス指標: 初回プロンプト後34トークン/秒、初回トークン応答時間0.7秒
モデル構成
ユーザーは以下のモデル設定を指定しました(すべてデフォルト値):
- GPUオフロード = 18
- CPUスレッドプールサイズ = 7
- 最大同時実行数 = 4
- エキスパート数 = 4
- フラッシュアテンション = オン
Q4_K_S量子化は、これは200億パラメーターモデルの4ビット量子化バージョンであり、合理的なパフォーマンスを維持しながらメモリ要件を削減します。Mac Miniの32GB RAMは、指定されたコンテキスト長でこのモデルサイズに十分です。34トークン/秒のスループットは、Apple Siliconハードウェア上で同様のローカルLLMセットアップを検討している開発者にとって実用的なベンチマークです。
📖 Read the full source: r/openclaw
👀 See Also

codebase-md: ツールはgitフックによるメンテナンスでCLAUDE.mdを自動生成します
codebase-md v0.1.0は、プロジェクトをスキャンして、アーキテクチャ検出、依存関係の健全性チェック、およびGitインサイトを含むCLAUDE.mdファイルを生成します。Gitフックを含めてドキュメントを最新の状態に保ち、追加の設定ファイルで他のAIコーディングツールをサポートします。

Claude Codeのセッション間でのコンテキスト喪失を解決するオープンソース永続メモリシステム
開発者がClaude Code向けにファイルベースのメモリシステムを構築し、プラグインやAPIキーなしでプロジェクトのコンテキストを自動的にキャプチャします。会話の記録、インボックスファイル、毎夜のcronジョブを利用して、セッション間で永続的なメモリを維持します。

Qure: 記録されたブラウザ操作フローからE2Eテストを生成するデスクトップアプリ
QureはJetBrainsが開発したデスクトップアプリケーション(現在はクローズドベータ版)で、内蔵ブラウザで記録した操作からエンドツーエンドのWebテストコードを生成します。開発者はAIエージェントにテキストでテストフローを説明する代わりに、製品を操作して手動QAシナリオを記録し、AIが既存のコードベースに合った動作するテストコードを作成します。

Mac上でMCPを介してClaudeにローカルLLMをアシスタントとして提供する
開発者がClaudeをOllamaとMCPを介してローカルのQwen 2.5 Coder 14Bに接続し、テキスト処理や大規模ファイルの処理などのタスクを委任するための無料アシスタントを作成。