DeepSeek V4 Flash через MCP: снижаем расходы на Claude в 60 раз

Пользователь Reddit проанализировал свое использование Claude и обнаружил, что большая часть расходов приходилась на механические задачи: классификацию файлов, переформатирование JSON, извлечение полей из текста и саммаризацию документов, которые он все равно просматривал мельком. Никакой из этих задач не требовал Sonnet. Решение: маленькая дешевая модель, работающая как вспомогательный инструмент через MCP, плюс одно правило в CLAUDE.md, запрещающее Claude выполнять эти задачи.

Настройка: MCP-инструмент + deny-list в CLAUDE.md

Настройка использует один MCP-инструмент, который отправляет текст и получает текст в ответ. Модель по умолчанию — DeepSeek V4 Flash (дешевая, 1M контекст). Эндпоинт задается одной строкой конфигурации и работает с любым провайдером, совместимым с OpenAI (локальный ollama, vllm, lm studio). Репозиторий: github.com/arizen-dev/deepseek-mcp (MIT, Python 3.10+).

Критический момент: правило в CLAUDE.md использует негативную формулировку — список запретов, а не разрешений. Пользователь сообщает, что позитивная формулировка («используй DeepSeek для X») игнорировалась примерно в 30% случаев. Подход с списком запретов срабатывает надежно.

# In CLAUDE.md:
# do NOT use Claude for:
# - json formatting
# - field extraction
# - file classification
# - summarization you will review anyway

Результаты: снижение затрат в 60 раз

За 3 недели реального использования: 217 механических вызовов перенесено на DeepSeek V4 Flash, общие расходы составили $0.41. Та же нагрузка на Sonnet обошлась бы примерно в $7. Это множитель примерно в 17 раз только для этих задач, и пользователь сообщает, что общий счет упал в 60 раз с учетом более тяжелых задач, оставшихся на Sonnet.

Как работает вспомогательный инструмент

Вспомогательный инструмент — это контролируемый инструмент, а не агент: никаких вызовов инструментов, доступа к файлам, цепочек. Задержка составляет 3–25 секунд. Вы проверяете результат. Вся схема: отправить текст, получить текст, проверить, двигаться дальше.

Для кого это

Для разработчиков, использующих Claude API или Claude Code, которые хотят сократить расходы на высокообъемные механические задачи, не теряя при этом возможности Sonnet для сложной работы.

📖 Read the full source: r/ClaudeAI

Снизьте расходы на Claude в 60 раз, передав механические задачи DeepSeek V4 Flash через MCP

Настройка: MCP-инструмент + deny-list в CLAUDE.md

Результаты: снижение затрат в 60 раз

Как работает вспомогательный инструмент

Для кого это

👀 Смотрите также

12GB VRAM 基准测试：在 RTX 4070 Super 上运行 Qwen 3.6 和 Gemma 4 模型

Результаты тестирования плагина памяти OpenClaw и рекомендуемый стек

OpenClaw Multi-Agent: 7 изолированных агентов за 5/месяц

Уроки по настройке рабочего пространства OpenClaw: опыт двух месяцев использования