Claude Kosten um 60x senken: MCP-Tool mit DeepSeek V4 Flash

Ein Reddit-Nutzer analysierte seine Claude-Nutzung und stellte fest, dass der Großteil auf mechanische Aufgaben entfiel: Dateien klassifizieren, JSON neu formatieren, Felder aus Texten extrahieren und Dokumente zusammenfassen, die er ohnehin überfliegen würde. Nichts davon benötigte Sonnet. Die Lösung: ein kleines, günstiges Modell, das als Side-Worker über MCP läuft, plus eine einzelne Regel in CLAUDE.md, die Claude anweist, diese Aufgaben nicht zu erledigen.

Einrichtung: ein MCP-Tool + CLAUDE.md-Deny-List

Die Einrichtung verwendet ein einzelnes MCP-Tool, das Text sendet und Text zurückerhält. Das Standardmodell ist DeepSeek V4 Flash (günstig, 1M Kontext). Der Endpunkt ist eine einzige Konfigurationszeile und funktioniert mit jedem OpenAI-kompatiblen Anbieter (lokales ollama, vllm, lm studio). Das Repository ist github.com/arizen-dev/deepseek-mcp (MIT, Python 3.10+).

Das entscheidende Element: Die CLAUDE.md-Regel verwendet negative Formulierung – eine Deny-List, keine Permission-List. Der Benutzer berichtet, dass positive Formulierung („Verwende DeepSeek für X“) zu etwa 30 % der Fälle ignoriert wurde. Der Deny-List-Ansatz fängt dies zuverlässig ab.

# In CLAUDE.md:
# NICHT Claude verwenden für:
# - JSON-Formatierung
# - Feldextraktion
# - Dateiklassifizierung
# - Zusammenfassungen, die du ohnehin überprüfst

Ergebnisse: 60-fache Kostenreduktion

Bei 3 Wochen echter Nutzung: 217 mechanische Aufrufe an DeepSeek V4 Flash ausgelagert, Gesamtkosten 0,41 $. Dieselbe Arbeitslast mit Sonnet hätte etwa 7 $ gekostet. Das ist ein etwa 17-facher Multiplikator allein für diese Aufgaben, und der Benutzer gibt an, dass die Gesamtrechnung um das 60-fache gesunken ist, wenn man die schwereren Aufgaben, die weiterhin auf Sonnet laufen, einbezieht.

Wie der Side-Worker arbeitet

Der Side-Worker ist ein überwachtes Tool, kein Agent – keine Tool-Aufrufe, kein Dateizugriff, keine Ketten. Die Latenz beträgt 3–25 Sekunden. Du überprüfst die Ausgabe. Das gesamte Konzept: Text senden, Text zurückerhalten, prüfen, weitermachen.

Für wen es gedacht ist

Entwickler, die die Claude-API oder Claude Code verwenden und die Kosten für stark frequentierte mechanische Aufgaben senken möchten, ohne auf die Argumentationsfähigkeiten von Sonnet für komplexe Arbeiten zu verzichten.

📖 Read the full source: r/ClaudeAI

Durch Auslagerung mechanischer Aufgaben an DeepSeek V4 Flash via MCP senkt Claude Kosten um das 60-fache

Einrichtung: ein MCP-Tool + CLAUDE.md-Deny-List

Ergebnisse: 60-fache Kostenreduktion

Wie der Side-Worker arbeitet

Für wen es gedacht ist

👀 Siehe auch

Entwurf von Einschränkungen für die Zuverlässigkeit von KI-Agenten in Produktionsumgebungen

OpenClaw Agent Kostenanalyse: Von 340 $ auf 112 $ monatlich mit fünf Optimierungen

Anthropic veröffentlicht Champion Kit für Claude Code-Adoption

Claude Code Skills vs. Custom Agents: Ein mentales Modell basierend auf Aufgabenkonsistenz