ローカルLLMをClaudeコードサブエージェントとして使う方法

r/LocalLLaMAの開発者が、Claude Codeを使用してLM Studio経由で実行されるローカルLLMにタスクを委任する方法を実演し、ファイルコンテンツをローカルに保持することでClaudeのコンテキスト使用量を削減しています。

仕組み

このシステムは、エージェントループを実行する小さなPythonスクリプト（約120行、標準ライブラリのみ）を使用します：

ファイルコンテンツなしでClaudeにタスク説明を渡す
スクリプトはread_fileとlist_dirツール定義を含めてLM Studioの/v1/chat/completionsエンドポイントに送信
ローカルモデルが自ら必要なファイルを読み取るためにそれらのツールを呼び出す
最終的な回答が生成されるまでループが継続
Claudeはファイルコンテンツではなく結果のみを確認

使用例

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"
# [turn 1] → read_file({'path': 'solar-system.html'})
# [turn 2] → このHTMLファイルはインタラクティブなアニメーション太陽系を作成します...

ファイルコンテンツはClaudeのコンテキストではなく、ローカルモデルのコンテキストに入ります（Apple Silicon上のMLX経由のQwen3.5 35B 4-bitでテスト済み）。

適している用途

コードの要約と説明
バグの発見
ボイラープレート/最初の草案の生成
テキスト変換と翻訳（ヘブライ語でテスト済み）
論理タスクと推論（難しい問題には--thinkフラグを使用）

適していない用途

関係性が重要なマルチファイル理解など、Claudeの完全なコンテキストを必要とするタスク
現在の会話履歴を必要とするタスク
正確性が重要なもの

作者はこれを「俳句レベルのアシスタントであり、代替品ではない」と表現しています。

セットアップ

APIサーバーが有効なLM Studioをローカルで実行
エージェントループ用のPythonスクリプト1つ、シンプルなプロンプトのみのクエリ用スクリプト1つ
両方をグローバルな~/.claude/CLAUDE.mdに接続し、Claude Codeが関連時に委任を提案できるようにする
MCPサーバー、pip依存関係、プラグインインフラは不要
推奨：Jinjaテンプレートの先頭に{%- set enable_thinking = false %}を追加 - ほとんどのタスクで品質を低下させずに時間とトークンを節約

作者は、Claudeに投稿の執筆を手伝わせたが監督と修正を行い、関心があればスクリプトを共有すると述べています。

📖 全文を読む： r/LocalLLaMA