MCP経由で機械的タスクをDeepSeek V4 FlashにオフロードしてClaudeのコストを60分の1に削減

✍️ OpenClawRadar📅 公開日: May 4, 2026🔗 Source
MCP経由で機械的タスクをDeepSeek V4 FlashにオフロードしてClaudeのコストを60分の1に削減
Ad

あるRedditユーザーがClaudeの使用状況を分析したところ、その大半が機械的なタスクに使われていることが判明しました。ファイルの分類、JSONの再フォーマット、テキストからのフィールド抽出、ざっと目を通すだけのドキュメントの要約などです。これらにSonnetを使う必要はまったくありませんでした。対策は、MCPを介してサイドワーカーとして動作する小型で安価なモデルと、CLAUDE.mdにそれらのタスクを実行しないように指示する1つのルールを追加することでした。

セットアップ:MCPツール + CLAUDE.md拒否リスト

セットアップでは、テキストを送信してテキストを受け取る単一のMCPツールを使用します。デフォルトのモデルはDeepSeek V4 Flash(低コスト、1Mコンテキスト)です。エンドポイントは1行の設定で、OpenAI互換プロバイダ(ローカルのollama、vllm、lm studio)で動作します。リポジトリはgithub.com/arizen-dev/deepseek-mcp(MIT、Python 3.10+)です。

重要な点は、CLAUDE.mdのルールが否定的なフレーミングを使用していることです。許可リストではなく拒否リストです。ユーザーによると、肯定的なフレーミング(「XにはDeepSeekを使う」)では約30%の確率で無視されたとのことです。拒否リストのアプローチでは確実に機能します。

# CLAUDE.md内:
# 以下のことにClaudeを使わない:
# - jsonフォーマット
# - フィールド抽出
# - ファイル分類
# - 後で自分で確認する要約
Ad

結果:60分の1のコスト削減

3週間の実際の使用で、217回の機械的な呼び出しがDeepSeek V4 Flashにオフロードされ、総費用は0.41ドルでした。同じワークロードをSonnetで実行した場合、約7ドルかかるところです。これらのタスクだけで約17倍の倍率であり、ユーザーによると、より重いタスクをSonnetに残した場合の全体の請求額は60分の1に削減されたとのことです。

サイドワーカーの動作方法

サイドワーカーはエージェントではなく、監視下のツールです。ツール呼び出し、ファイルアクセス、チェーンは行いません。レイテンシは3〜25秒です。出力を確認します。全体の流れは、テキストを送信し、テキストを受け取り、確認し、次に進む、というものです。

対象者

Claude APIまたはClaude Codeを使用している開発者で、複雑な作業にはSonnetの推論能力を維持しつつ、大量の機械的なタスクにかかるコストを削減したい方。

📖 全文はこちら: r/ClaudeAI

Ad

👀 See Also

DeepSeek-V4-Flash W4A16+FP8とMTP自己推測:2x RTX PRO 6000 Max-Qで毎秒85トークン
Guides

DeepSeek-V4-Flash W4A16+FP8とMTP自己推測:2x RTX PRO 6000 Max-Qで毎秒85トークン

DeepSeek-V4-FlashをW4A16+FP8に量子化し、MTPヘッドを後付けしたパッチ済みvLLMを使用して、2× RTX PRO 6000 Max-Q上で524kコンテキストにおいて85.52 tok/sを達成(ベースラインの52.85 tok/sから向上)。

OpenClawRadar
Claude CodeをOllama経由でルーティングし、費用を約90%削減
Guides

Claude CodeをOllama経由でルーティングし、費用を約90%削減

Claude DesktopとOllama対応のClaude Codeを連携:戦略的な作業はAnthropicに任せ、負荷の高いタスクはGemma、Qwen、DeepSeekなどの無料オープンソースモデルで実行。セットアップの約98%を自動化するコピペ用プロンプト付き。

OpenClawRadar
トラブルシューティング OpenClaw: ミニマリストのリセット方法
Guides

トラブルシューティング OpenClaw: ミニマリストのリセット方法

Redditユーザーが、不安定なOpenClawセットアップを修正する5段階の方法を共有。すべてのスキルを削除し、Claude Sonnetに切り替え、セッションをクリアし、SOUL.mdを簡素化し、基本的なコマンドでテストする。

OpenClawRadar
OpenClawワークスペース構造と長年ユーザーからの自己改善アプローチ
Guides

OpenClawワークスペース構造と長年ユーザーからの自己改善アプローチ

長年OpenClawを使用しているユーザーが、SOUL.md、AGENTS.md、MEMORY.mdなどの主要なマークダウンファイルを含むワークスペース構造を共有し、エージェントが自身の環境を改善できるようにすることが効果を劇的に高めるという重要な教訓を伝えています。

OpenClawRadar