Claude Code überträgt Codierung an Mistral/DeepSeek: 57M Tokens eingespart, 90-100 % Kostenreduktion

Der Entwickler pcx_wave veröffentlichte eine detaillierte Analyse von vibe-skill, einer Claude Code-Funktion, die Programmieraufgaben an günstigere Modelle (Mistral oder DeepSeek) delegiert, während Claude für die Planung und Überprüfung zuständig ist. Nach 10 Tagen und 254 Ausführungen wurden 57 Millionen Tokens eingespart und die Kosten um 90-100% gesenkt, bei gleichbleibender Claude-Qualität der Ergebnisse.
Wie es funktioniert
Vibe-skill läuft innerhalb von Claude Code. Du tippst /vibeon <was auch immer>, Claude zerlegt die Aufgabe und delegiert die eigentliche Codierung an ein leichtgewichtiges Modell (über das Open-Source-Tool Vibe). Anschließend überprüft Claude den Diff und korrigiert Fehler. Das günstige Modell verbraucht die Tokens; Claude gibt nur Tokens für Planung und Überprüfung aus.
Ergebnisse nach Modell
| Modell | Delegierte Tokens | Tatsächliche Kosten | Claude-Äquivalent | Einsparung |
|---|---|---|---|---|
| DeepSeek V4 Flash | 29M | 4,13 $ | 92,16 $ | 95% |
| Mistral Medium 3.5 | 28M | 0 $ (Pro-Abo) | 84,77 $ | 100% |
Gesamterfolgsquote: 98% bei 254 Ausführungen. Wenn die Delegierung fehlschlägt, erkennt und korrigiert Claude die Ausgabe.
Token-Ökonomie
Mistral-Tokens sind etwa 50% günstiger als die von Claude; DeepSeek-Tokens sind 95% günstiger. Der Autor nutzt ein Mistral Pro-Abo (18,36 $/Monat), das etwa 1 Milliarde kostenlose Tokens enthält. Für Mistral Pro-Abonnenten kostet die Delegierung 0 $, bis das Kontingent erschöpft ist; danach wird automatisch auf DeepSeek zurückgegriffen (da Mistral PAYG mit 1,52 $/M Tokens 10× teurer ist als DeepSeek).
Der Break-even-Punkt: DeepSeek allein ist günstiger als das Mistral Pro-Abo, wenn du weniger als 131M Tokens/Monat delegierst (18,36 $ / 0,14 $ pro M). Oberhalb dieses Volumens gewinnt Mistral Pro mit etwa 10× mehr Spielraum, bevor das Kontingent erreicht wird.
Einrichtung
Die Funktion ist Open Source unter github.com/pcx-wave/vibe-skill. Eine ähnliche Gemini-Funktion ist ebenfalls verfügbar, aber weniger konfigurierbar und instabil. Um sie zu nutzen, klone das Repository und lade die Funktion in Claude Code — dann einfach /vibeon für deine Aufgabe.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

Benchmark zeigt: KI-Browser-Automatisierungstools variieren um das 2,6-fache bei den Token-Kosten trotz identischer Genauigkeit
Ein Benchmark von 4 CLI-Browser-Automatisierungstools mit Claude Sonnet 4.6 bei 6 realen Aufgaben ergab, dass alle 100% Genauigkeit erreichten, aber openbrowser-ai 36.010 Tokens verwendete, während andere 77.123–94.130 Tokens benötigten. Die Anzahl der Tool-Aufrufe war der stärkste Prädiktor für die Token-Kosten.

Hyper iOS App: Sprachnotizen-App mit Echtzeit-Transkription und Aktionserkennung
Hyper ist eine iOS-Sprachaufnahme-App, die Gespräche in Echtzeit transkribiert, Zusammenfassungen und Aktionspunkte liefert und mittels Wakeword-Erkennung Abfragen während des Gesprächs ermöglicht. Sie ist für unstrukturierte Meetings wie 1:1-Gespräche, Kaffeepausen und Standups konzipiert.

Exploration der Claude-Code-Richtlinien: Ein minimalistischer Ansatz in 65 Zeilen.
Die Claude Code-Erweiterung fasst essentielle KI-Coding-Prinzipien in nur 65 Zeilen Markdown zusammen und betont 'Denken vor dem Programmieren'. Trotz ihrer Einfachheit hat sie bei Entwicklern bemerkenswerte Popularität erlangt.
TextGen (text-generation-webui) wird native Desktop-App mit portablen Builds
TextGen, die Open-Source-Alternative zu LM Studio, hat sich von einer Web-UI zu einer Desktop-App ohne Installation für Windows, Linux und macOS mit portablen Builds, vollständiger Privatsphäre und erweiterter Quantisierungsunterstützung entwickelt.