Reduzca Costos de Claude 60x con DeepSeek V4 Flash vía MCP

Un usuario de Reddit analizó su uso de Claude y descubrió que la mayor parte se destinaba a tareas mecánicas: clasificar archivos, reformatear JSON, extraer campos de texto y resumir documentos que de todos modos hojeaba. Nada de eso necesitaba Sonnet. La solución: un modelo pequeño y económico que funciona como trabajador secundario a través de MCP, más una única regla en CLAUDE.md que le indica a Claude que no realice esas tareas.

Configuración: una herramienta MCP + lista de denegación en CLAUDE.md

La configuración utiliza una sola herramienta MCP que envía texto y recibe texto. El modelo predeterminado es DeepSeek V4 Flash (económico, 1M de contexto). El endpoint es una línea de configuración y funciona con cualquier proveedor compatible con OpenAI (ollama local, vllm, lm studio). El repositorio es github.com/arizen-dev/deepseek-mcp (MIT, Python 3.10+).

La pieza clave: la regla en CLAUDE.md usa un enfoque negativo — una lista de denegación, no una lista de permisos. El usuario informa que el enfoque positivo ("usa DeepSeek para X") se ignoraba ~30% de las veces. El enfoque de lista de denegación lo captura de manera confiable.

# En CLAUDE.md:
# NO uses Claude para:
# - formateo de JSON
# - extracción de campos
# - clasificación de archivos
# - resúmenes que revisarás de todos modos

Resultados: reducción de costos de 60x

Durante 3 semanas de uso real: 217 llamadas mecánicas transferidas a DeepSeek V4 Flash, con un gasto total de $0.41. La misma carga de trabajo en Sonnet habría costado aproximadamente $7. Eso es un multiplicador de ~17x solo en esas tareas, y el usuario dice que la factura total se redujo 60x al considerar las tareas más pesadas que aún se ejecutan en Sonnet.

Cómo opera el trabajador secundario

El trabajador secundario es una herramienta supervisada, no un agente — sin llamadas a herramientas, sin acceso a archivos, sin cadenas. La latencia es de 3 a 25 segundos. Tú revisas la salida. La dinámica es: enviar texto, recibir texto, revisar, seguir adelante.

Para quién es

Desarrolladores que usan la API de Claude o Claude Code y desean reducir el gasto en tareas mecánicas de alto volumen sin perder la capacidad de razonamiento de Sonnet para trabajos complejos.

📖 Lee la fuente completa: r/ClaudeAI

Reduzca los costos de Claude en 60x descargando tareas mecánicas a DeepSeek V4 Flash a través de MCP

Configuración: una herramienta MCP + lista de denegación en CLAUDE.md

Resultados: reducción de costos de 60x

Cómo opera el trabajador secundario

Para quién es

👀 Ver también

Dificultades de instalación de OpenClaw en Windows 11 para usuarios no desarrolladores

Arquitectura de memoria de tres capas para el contexto persistente del agente OpenClaw

Documentación para escribir herramientas MCP en C# .NET Framework para Claude Desktop/Code

Solución de problemas de OpenClaw: Un método de reinicio minimalista