Durch Auslagerung mechanischer Aufgaben an DeepSeek V4 Flash via MCP senkt Claude Kosten um das 60-fache

✍️ OpenClawRadar📅 Veröffentlicht: 4. Mai 2026🔗 Source
Durch Auslagerung mechanischer Aufgaben an DeepSeek V4 Flash via MCP senkt Claude Kosten um das 60-fache
Ad

Ein Reddit-Nutzer analysierte seine Claude-Nutzung und stellte fest, dass der Großteil auf mechanische Aufgaben entfiel: Dateien klassifizieren, JSON neu formatieren, Felder aus Texten extrahieren und Dokumente zusammenfassen, die er ohnehin überfliegen würde. Nichts davon benötigte Sonnet. Die Lösung: ein kleines, günstiges Modell, das als Side-Worker über MCP läuft, plus eine einzelne Regel in CLAUDE.md, die Claude anweist, diese Aufgaben nicht zu erledigen.

Einrichtung: ein MCP-Tool + CLAUDE.md-Deny-List

Die Einrichtung verwendet ein einzelnes MCP-Tool, das Text sendet und Text zurückerhält. Das Standardmodell ist DeepSeek V4 Flash (günstig, 1M Kontext). Der Endpunkt ist eine einzige Konfigurationszeile und funktioniert mit jedem OpenAI-kompatiblen Anbieter (lokales ollama, vllm, lm studio). Das Repository ist github.com/arizen-dev/deepseek-mcp (MIT, Python 3.10+).

Das entscheidende Element: Die CLAUDE.md-Regel verwendet negative Formulierung – eine Deny-List, keine Permission-List. Der Benutzer berichtet, dass positive Formulierung („Verwende DeepSeek für X“) zu etwa 30 % der Fälle ignoriert wurde. Der Deny-List-Ansatz fängt dies zuverlässig ab.

# In CLAUDE.md:
# NICHT Claude verwenden für:
# - JSON-Formatierung
# - Feldextraktion
# - Dateiklassifizierung
# - Zusammenfassungen, die du ohnehin überprüfst
Ad

Ergebnisse: 60-fache Kostenreduktion

Bei 3 Wochen echter Nutzung: 217 mechanische Aufrufe an DeepSeek V4 Flash ausgelagert, Gesamtkosten 0,41 $. Dieselbe Arbeitslast mit Sonnet hätte etwa 7 $ gekostet. Das ist ein etwa 17-facher Multiplikator allein für diese Aufgaben, und der Benutzer gibt an, dass die Gesamtrechnung um das 60-fache gesunken ist, wenn man die schwereren Aufgaben, die weiterhin auf Sonnet laufen, einbezieht.

Wie der Side-Worker arbeitet

Der Side-Worker ist ein überwachtes Tool, kein Agent – keine Tool-Aufrufe, kein Dateizugriff, keine Ketten. Die Latenz beträgt 3–25 Sekunden. Du überprüfst die Ausgabe. Das gesamte Konzept: Text senden, Text zurückerhalten, prüfen, weitermachen.

Für wen es gedacht ist

Entwickler, die die Claude-API oder Claude Code verwenden und die Kosten für stark frequentierte mechanische Aufgaben senken möchten, ohne auf die Argumentationsfähigkeiten von Sonnet für komplexe Arbeiten zu verzichten.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Entwurf von Einschränkungen für die Zuverlässigkeit von KI-Agenten in Produktionsumgebungen
Anleitungen

Entwurf von Einschränkungen für die Zuverlässigkeit von KI-Agenten in Produktionsumgebungen

Ein Reddit-Beitrag beschreibt einen einschränkungsbasierten Ansatz zur Nutzung von Claude für komplexe Codebasis-Operationen. Dabei werden explizite Aufzählungen von Fehlermodi, gestaffelte Ausführung mit Kontrollpunkten und Anti-Kurzschluss-Regeln betont, um beim Entfernen von 140 Dateien keine fehlerhaften Builds zu erzeugen.

OpenClawRadar
OpenClaw Agent Kostenanalyse: Von 340 $ auf 112 $ monatlich mit fünf Optimierungen
Anleitungen

OpenClaw Agent Kostenanalyse: Von 340 $ auf 112 $ monatlich mit fünf Optimierungen

Ein Entwickler verfolgte 30 Tage lang 18.000 API-Aufrufe über vier OpenClaw-Agenten und stellte fest, dass 70 % der Aufgaben GPT-4.1 nicht benötigten. Durch die Implementierung von Prompt-Caching, kürzeren Systemprompts, gebündelten Analysen, der Umstellung auf günstigere Modelle und der Einführung von Token-Limits sanken die Kosten von 340 $ auf 112 $ monatlich.

OpenClawRadar
Anthropic veröffentlicht Champion Kit für Claude Code-Adoption
Anleitungen

Anthropic veröffentlicht Champion Kit für Claude Code-Adoption

Ein Playbook für Ingenieure, die Claude Code in ihrem Unternehmen vorantreiben: Teilen Sie wiederverwendbare Prompts, antworten Sie in öffentlichen Kanälen und hosten Sie einen wöchentlichen Show-and-Tell-Thread – insgesamt etwa 40 Minuten pro Woche.

OpenClawRadar
Claude Code Skills vs. Custom Agents: Ein mentales Modell basierend auf Aufgabenkonsistenz
Anleitungen

Claude Code Skills vs. Custom Agents: Ein mentales Modell basierend auf Aufgabenkonsistenz

Ein Reddit-Nutzer erläutert den Unterschied zwischen Claude-Code-Fähigkeiten und benutzerdefinierten Agenten: Fähigkeiten führen jedes Mal dieselben Schritte aus, während benutzerdefinierte Agenten Denkvermögen und Anpassungsfähigkeit erfordern. Der Beitrag behandelt auch parallele Subagenten, Delegation, Hooks und Bausteine.

OpenClawRadar