ローカルLLMをClaudeコードサブエージェントとして使用してコンテキスト使用量を削減する

r/LocalLLaMAの開発者が、Claude Codeを使用してLM Studio経由で実行されるローカルLLMにタスクを委任する方法を実演し、ファイルコンテンツをローカルに保持することでClaudeのコンテキスト使用量を削減しています。
仕組み
このシステムは、エージェントループを実行する小さなPythonスクリプト(約120行、標準ライブラリのみ)を使用します:
- ファイルコンテンツなしでClaudeにタスク説明を渡す
- スクリプトは
read_fileとlist_dirツール定義を含めてLM Studioの/v1/chat/completionsエンドポイントに送信 - ローカルモデルが自ら必要なファイルを読み取るためにそれらのツールを呼び出す
- 最終的な回答が生成されるまでループが継続
- Claudeはファイルコンテンツではなく結果のみを確認
使用例
python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"
# [turn 1] → read_file({'path': 'solar-system.html'})
# [turn 2] → このHTMLファイルはインタラクティブなアニメーション太陽系を作成します...
ファイルコンテンツはClaudeのコンテキストではなく、ローカルモデルのコンテキストに入ります(Apple Silicon上のMLX経由のQwen3.5 35B 4-bitでテスト済み)。
適している用途
- コードの要約と説明
- バグの発見
- ボイラープレート/最初の草案の生成
- テキスト変換と翻訳(ヘブライ語でテスト済み)
- 論理タスクと推論(難しい問題には
--thinkフラグを使用)
適していない用途
- 関係性が重要なマルチファイル理解など、Claudeの完全なコンテキストを必要とするタスク
- 現在の会話履歴を必要とするタスク
- 正確性が重要なもの
作者はこれを「俳句レベルのアシスタントであり、代替品ではない」と表現しています。
セットアップ
- APIサーバーが有効なLM Studioをローカルで実行
- エージェントループ用のPythonスクリプト1つ、シンプルなプロンプトのみのクエリ用スクリプト1つ
- 両方をグローバルな
~/.claude/CLAUDE.mdに接続し、Claude Codeが関連時に委任を提案できるようにする - MCPサーバー、pip依存関係、プラグインインフラは不要
- 推奨:Jinjaテンプレートの先頭に
{%- set enable_thinking = false %}を追加 - ほとんどのタスクで品質を低下させずに時間とトークンを節約
作者は、Claudeに投稿の執筆を手伝わせたが監督と修正を行い、関心があればスクリプトを共有すると述べています。
📖 全文を読む: r/LocalLLaMA
👀 See Also

Spectyra OpenClaw用プラグイン:全リクエストフロー分析によるリアルタイムAIコスト最適化
Spectyraプラグインは、繰り返しの呼び出し、過剰なコンテキスト、高価なモデルの誤用などの隠れた無駄をリアルタイムで可視化し、AI APIコストを削減します。

エージェンティックストア MCP: Claude Desktop用Pythonツールキット、27のローカルツールを搭載
AgenticStore MCPは、複数のMCPサーバーを単一のインストールで置き換えるオープンソースのPythonツールキットです。DockerやNode.jsの設定を必要とせず、永続的なメモリ、ウェブ検索、リポジトリ監査を含む27のローカルツールをClaude Desktopに提供します。

AIコーディングエージェントのための再帰的自己改善フレームワーク(Claude Code使用)
オープンソースのフレームワークにより、AIコーディングエージェントがClaude Codeを使用して再帰的に自己改善できるようになります。このシステムはエージェントの実行トレースを分析し、失敗パターンを特定して修正を実装し、1回のテストサイクルで25%の性能向上を達成しました。

フリースタイル、ライブフォーク機能を備えたAIコーディングエージェント向けサンドボックスをローンチ
Freestyleは、約500msで起動し、ライブフォーク機能(400ms未満の一時停止)を備えたAIコーディングエージェント向けクラウドサンドボックスを提供します。これにより、メモリ状態を含む完全なVMクローンが可能になります。フルDebianをハードウェア仮想化で実行し、ベアメタルインフラ上で動作します。