ローカルLLMをClaudeコードサブエージェントとして使用してコンテキスト使用量を削減する

✍️ OpenClawRadar📅 公開日: March 2, 2026🔗 Source

ローカルLLMをClaudeコードサブエージェントとして使用してコンテキスト使用量を削減する

Ad

Claude Codeは、Claudeのサブエージェントを使用する方法と同様に、ローカルLLMにタスクを委譲することで作業を調整できます。このアプローチにより、ファイルの内容はClaudeのコンテキストから除外され、ローカルモデルの要約と洞察のみが返されます。

仕組み

小さなPythonスクリプト（約120行、標準ライブラリのみ）がエージェントループを実行します：

ファイルの内容なしでClaudeにタスクの説明を渡します
スクリプトはread_fileとlist_dirツール定義を含めて、LM Studioの/v1/chat/completionsエンドポイントに送信します
ローカルモデルは必要なファイルを読み取るためにそれらのツールを自ら呼び出します
最終的な回答が生成されるまでループが続きます
Claudeは結果のみを確認します

コマンド例：

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"

これにより以下が生成されます：

[ターン1] → read_file({'path': 'solar-system.html'})
[ターン2] → このHTMLファイルはインタラクティブなアニメーション太陽系を作成します...

ファイルの内容はClaudeのコンテキストではなく、ローカルモデルのコンテキスト（Qwenのコンテキストでテスト済み）に入ります。

Ad

ユースケースと制限事項

Apple Silicon上のMLXを介したQwen3.5 35B 4-bitでのテストに基づくと、このアプローチは以下に適しています：

コードの要約と説明
バグの発見
ボイラープレート/初稿の生成
テキストの変換と翻訳（ヘブライ語でテスト済み）
論理タスクと推論（難しい問題には--thinkフラグを使用）

以下には適していません：

Claudeの完全なコンテキストを必要とするタスク
関係性が重要なマルチファイル理解
現在の会話履歴を必要とするタスク
正確性が重要なもの

これをClaudeの代替ではなく、Haikuレベルのアシスタントと考えてください。

セットアップ要件

APIサーバーが有効な状態でローカルで実行されているLM Studio
エージェントループ用のPythonスクリプト1つ、シンプルなプロンプトのみのクエリ用のスクリプト1つ
両方をグローバルな~/.claude/CLAUDE.mdに接続し、Claude Codeが関連する時に委譲を提供するようにします
MCPサーバー、pip依存関係、プラグインインフラは不要です

設定のヒント：Jinjaテンプレートの先頭に{%- set enable_thinking = false %}を追加します。ほとんどのタスクでは、ローカルモデルに推論させる必要はなく、これにより時間とトークンを節約し、速度を向上させ、そのようなタスクでは品質の低下はほとんどありません。

📖 完全なソースを読む： r/ClaudeAI

Ad

👀 See Also

ジェンティック・ミニ：OpenClaw用セルフホスト型APIおよびアクション実行レイヤー

ジェンティック・ミニ：OpenClaw用セルフホスト型APIおよびアクション実行レイヤー

Jentic Miniは、AIエージェントと外部APIの間に位置するセルフホスト型のAPIおよびアクション実行レイヤーで、認証情報を暗号化された保管庫に保存し、個別に取り消し可能なキーを持つスコープ付きツールキットを提供します。認証情報を追加すると、10,000以上のOpenAPI仕様とArazzoワークフローソースを自動的にインポートします。

Apr 15, 2026, 08:17 AM UTC

ReasonDB: ベクトル検索ではなくLLM誘導ツリーナビゲーションを使用するオープンソースドキュメントデータベース

ReasonDB: ベクトル検索ではなくLLM誘導ツリーナビゲーションを使用するオープンソースドキュメントデータベース

ReasonDBは、ドキュメント構造を階層として保持し、ベクトル検索の代わりにLLMガイドによるツリートラバーサルを検索に使用するオープンソースのドキュメントデータベースです。初期検索にはBM25を使用し、構造フィルタリングにはtree-grepを使用し、LLMが数百万ノードのうち約25ノードを訪問するビームサーチトラバーサルを採用しています。

Feb 27, 2026, 02:45 AM UTC

DeepSeek V4 FlashがオンプレミスのローカルLLMにOpusに迫る品質を提供

DeepSeek V4 FlashがオンプレミスのローカルLLMにOpusに迫る品質を提供

Redditユーザーが、DeepSeek 4 Flashが機密データを扱うローカルAIエージェントでOpusに迫るパフォーマンスを達成し、AWSなしでのオンプレミス展開を可能にしたと報告。NVIDIA GPUでローカル実行中だが、100万トークンでまだ遅い。

May 9, 2026, 04:17 PM UTC

Membase：ツールを超えたAIアシスタントのための外部メモリレイヤー

Membase：ツールを超えたAIアシスタントのための外部メモリレイヤー

Membaseは、会話コンテキストを知識グラフに抽出・保存し、関連する記憶をClaude、ChatGPT、Cursor、GeminiなどのAIツール間の新規チャットに注入する外部メモリレイヤーです。現在はプライベートベータ版で、すべての機能が無料で利用できます。

Mar 22, 2026, 04:45 AM UTC