ローカルLLMをClaudeコードサブエージェントとして使用してコンテキスト使用量を削減する

✍️ OpenClawRadar📅 公開日: March 2, 2026🔗 Source
ローカルLLMをClaudeコードサブエージェントとして使用してコンテキスト使用量を削減する
Ad

r/LocalLLaMAの開発者が、Claude Codeを使用してLM Studio経由で実行されるローカルLLMにタスクを委任する方法を実演し、ファイルコンテンツをローカルに保持することでClaudeのコンテキスト使用量を削減しています。

仕組み

このシステムは、エージェントループを実行する小さなPythonスクリプト(約120行、標準ライブラリのみ)を使用します:

  • ファイルコンテンツなしでClaudeにタスク説明を渡す
  • スクリプトはread_filelist_dirツール定義を含めてLM Studioの/v1/chat/completionsエンドポイントに送信
  • ローカルモデルが自ら必要なファイルを読み取るためにそれらのツールを呼び出す
  • 最終的な回答が生成されるまでループが継続
  • Claudeはファイルコンテンツではなく結果のみを確認

使用例

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"
# [turn 1] → read_file({'path': 'solar-system.html'})
# [turn 2] → このHTMLファイルはインタラクティブなアニメーション太陽系を作成します...

ファイルコンテンツはClaudeのコンテキストではなく、ローカルモデルのコンテキストに入ります(Apple Silicon上のMLX経由のQwen3.5 35B 4-bitでテスト済み)。

適している用途

  • コードの要約と説明
  • バグの発見
  • ボイラープレート/最初の草案の生成
  • テキスト変換と翻訳(ヘブライ語でテスト済み)
  • 論理タスクと推論(難しい問題には--thinkフラグを使用)
Ad

適していない用途

  • 関係性が重要なマルチファイル理解など、Claudeの完全なコンテキストを必要とするタスク
  • 現在の会話履歴を必要とするタスク
  • 正確性が重要なもの

作者はこれを「俳句レベルのアシスタントであり、代替品ではない」と表現しています。

セットアップ

  • APIサーバーが有効なLM Studioをローカルで実行
  • エージェントループ用のPythonスクリプト1つ、シンプルなプロンプトのみのクエリ用スクリプト1つ
  • 両方をグローバルな~/.claude/CLAUDE.mdに接続し、Claude Codeが関連時に委任を提案できるようにする
  • MCPサーバー、pip依存関係、プラグインインフラは不要
  • 推奨:Jinjaテンプレートの先頭に{%- set enable_thinking = false %}を追加 - ほとんどのタスクで品質を低下させずに時間とトークンを節約

作者は、Claudeに投稿の執筆を手伝わせたが監督と修正を行い、関心があればスクリプトを共有すると述べています。

📖 全文を読む: r/LocalLLaMA

Ad

👀 See Also

Spectyra OpenClaw用プラグイン:全リクエストフロー分析によるリアルタイムAIコスト最適化
Tools

Spectyra OpenClaw用プラグイン:全リクエストフロー分析によるリアルタイムAIコスト最適化

Spectyraプラグインは、繰り返しの呼び出し、過剰なコンテキスト、高価なモデルの誤用などの隠れた無駄をリアルタイムで可視化し、AI APIコストを削減します。

OpenClawRadar
エージェンティックストア MCP: Claude Desktop用Pythonツールキット、27のローカルツールを搭載
Tools

エージェンティックストア MCP: Claude Desktop用Pythonツールキット、27のローカルツールを搭載

AgenticStore MCPは、複数のMCPサーバーを単一のインストールで置き換えるオープンソースのPythonツールキットです。DockerやNode.jsの設定を必要とせず、永続的なメモリ、ウェブ検索、リポジトリ監査を含む27のローカルツールをClaude Desktopに提供します。

OpenClawRadar
AIコーディングエージェントのための再帰的自己改善フレームワーク(Claude Code使用)
Tools

AIコーディングエージェントのための再帰的自己改善フレームワーク(Claude Code使用)

オープンソースのフレームワークにより、AIコーディングエージェントがClaude Codeを使用して再帰的に自己改善できるようになります。このシステムはエージェントの実行トレースを分析し、失敗パターンを特定して修正を実装し、1回のテストサイクルで25%の性能向上を達成しました。

OpenClawRadar
フリースタイル、ライブフォーク機能を備えたAIコーディングエージェント向けサンドボックスをローンチ
Tools

フリースタイル、ライブフォーク機能を備えたAIコーディングエージェント向けサンドボックスをローンチ

Freestyleは、約500msで起動し、ライブフォーク機能(400ms未満の一時停止)を備えたAIコーディングエージェント向けクラウドサンドボックスを提供します。これにより、メモリ状態を含む完全なVMクローンが可能になります。フルDebianをハードウェア仮想化で実行し、ベアメタルインフラ上で動作します。

OpenClawRadar