Claude Code überträgt Codierung an Mistral/DeepSeek: 57M Tokens eingespart, 90-100 % Kostenreduktion

✍️ OpenClawRadar📅 Veröffentlicht: 27. Mai 2026🔗 Source
Claude Code überträgt Codierung an Mistral/DeepSeek: 57M Tokens eingespart, 90-100 % Kostenreduktion
Ad

Der Entwickler pcx_wave veröffentlichte eine detaillierte Analyse von vibe-skill, einer Claude Code-Funktion, die Programmieraufgaben an günstigere Modelle (Mistral oder DeepSeek) delegiert, während Claude für die Planung und Überprüfung zuständig ist. Nach 10 Tagen und 254 Ausführungen wurden 57 Millionen Tokens eingespart und die Kosten um 90-100% gesenkt, bei gleichbleibender Claude-Qualität der Ergebnisse.

Wie es funktioniert

Vibe-skill läuft innerhalb von Claude Code. Du tippst /vibeon <was auch immer>, Claude zerlegt die Aufgabe und delegiert die eigentliche Codierung an ein leichtgewichtiges Modell (über das Open-Source-Tool Vibe). Anschließend überprüft Claude den Diff und korrigiert Fehler. Das günstige Modell verbraucht die Tokens; Claude gibt nur Tokens für Planung und Überprüfung aus.

Ergebnisse nach Modell

ModellDelegierte TokensTatsächliche KostenClaude-ÄquivalentEinsparung
DeepSeek V4 Flash29M4,13 $92,16 $95%
Mistral Medium 3.528M0 $ (Pro-Abo)84,77 $100%

Gesamterfolgsquote: 98% bei 254 Ausführungen. Wenn die Delegierung fehlschlägt, erkennt und korrigiert Claude die Ausgabe.

Ad

Token-Ökonomie

Mistral-Tokens sind etwa 50% günstiger als die von Claude; DeepSeek-Tokens sind 95% günstiger. Der Autor nutzt ein Mistral Pro-Abo (18,36 $/Monat), das etwa 1 Milliarde kostenlose Tokens enthält. Für Mistral Pro-Abonnenten kostet die Delegierung 0 $, bis das Kontingent erschöpft ist; danach wird automatisch auf DeepSeek zurückgegriffen (da Mistral PAYG mit 1,52 $/M Tokens 10× teurer ist als DeepSeek).

Der Break-even-Punkt: DeepSeek allein ist günstiger als das Mistral Pro-Abo, wenn du weniger als 131M Tokens/Monat delegierst (18,36 $ / 0,14 $ pro M). Oberhalb dieses Volumens gewinnt Mistral Pro mit etwa 10× mehr Spielraum, bevor das Kontingent erreicht wird.

Einrichtung

Die Funktion ist Open Source unter github.com/pcx-wave/vibe-skill. Eine ähnliche Gemini-Funktion ist ebenfalls verfügbar, aber weniger konfigurierbar und instabil. Um sie zu nutzen, klone das Repository und lade die Funktion in Claude Code — dann einfach /vibeon für deine Aufgabe.

📖 Vollständige Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Benchmark zeigt: KI-Browser-Automatisierungstools variieren um das 2,6-fache bei den Token-Kosten trotz identischer Genauigkeit
Werkzeuge

Benchmark zeigt: KI-Browser-Automatisierungstools variieren um das 2,6-fache bei den Token-Kosten trotz identischer Genauigkeit

Ein Benchmark von 4 CLI-Browser-Automatisierungstools mit Claude Sonnet 4.6 bei 6 realen Aufgaben ergab, dass alle 100% Genauigkeit erreichten, aber openbrowser-ai 36.010 Tokens verwendete, während andere 77.123–94.130 Tokens benötigten. Die Anzahl der Tool-Aufrufe war der stärkste Prädiktor für die Token-Kosten.

OpenClawRadar
Hyper iOS App: Sprachnotizen-App mit Echtzeit-Transkription und Aktionserkennung
Werkzeuge

Hyper iOS App: Sprachnotizen-App mit Echtzeit-Transkription und Aktionserkennung

Hyper ist eine iOS-Sprachaufnahme-App, die Gespräche in Echtzeit transkribiert, Zusammenfassungen und Aktionspunkte liefert und mittels Wakeword-Erkennung Abfragen während des Gesprächs ermöglicht. Sie ist für unstrukturierte Meetings wie 1:1-Gespräche, Kaffeepausen und Standups konzipiert.

OpenClawRadar
Exploration der Claude-Code-Richtlinien: Ein minimalistischer Ansatz in 65 Zeilen.
Werkzeuge

Exploration der Claude-Code-Richtlinien: Ein minimalistischer Ansatz in 65 Zeilen.

Die Claude Code-Erweiterung fasst essentielle KI-Coding-Prinzipien in nur 65 Zeilen Markdown zusammen und betont 'Denken vor dem Programmieren'. Trotz ihrer Einfachheit hat sie bei Entwicklern bemerkenswerte Popularität erlangt.

OpenClawRadar
🦀
Werkzeuge

TextGen (text-generation-webui) wird native Desktop-App mit portablen Builds

TextGen, die Open-Source-Alternative zu LM Studio, hat sich von einer Web-UI zu einer Desktop-App ohne Installation für Windows, Linux und macOS mit portablen Builds, vollständiger Privatsphäre und erweiterter Quantisierungsunterstützung entwickelt.

OpenClawRadar