DeepSeek V4 Preise: 173x Günstigere Gecachte Tokens vs Opus

DeepSeek V4 wurde mit so niedrigen Preisen gestartet, dass ein Reddit-Nutzer die Rechnung überprüft hat. Hier sind die bestätigten Zahlen:

Preisaufschlüsselung

V4-Pro Standard-Input: 0,145 $ pro Million Tokens. Opus 4.7 Input: ~5 $ pro Million. Verhältnis: 34x.
Mit 75 % Rabattaktion (bis Ende Mai): V4-Pro Input sinkt auf 0,036 $ pro Million – 138x günstiger als Opus.
Cache-Treffer-Preis: V4-Pro liegt bei 0,0036 $ pro Million. Opus gecached bei 0,625 $ pro Million. Verhältnis: 173x.

Der Haken

Wie der ursprüngliche Beitrag anmerkt, gibt DeepSeek selbst zu, dass V4 in puncto Leistung drei bis sechs Monate hinter GPT-5.4 und Gemini 3.1 Pro liegt. Sie bekommen nicht die Spitzenqualität geteilt durch 178, sondern die Spitzenqualität des letzten Sommers.

Was das für agentische Workflows bedeutet

Für agentische Schleifen mit starkem Caching (System-Prompts, Tool-Definitionen) ist der Cache-Treffer-Rabatt die eigentliche Geschichte. Wiederverwendbare System-Prompts werden praktisch kostenlos. Die entscheidende Unbekannte: ob das behauptete 1M-Kontextfenster unter realen Lasten hält oder auf nutzbare 200K abfällt, wie bei vielen Modellen mit großen Fenstern zu beobachten.

📖 Vollständige Quelle lesen: r/LocalLLaMA

DeepSeek V4 Preise im Realitätscheck: 178x günstigere gecachte Tokens im Vergleich zu Opus, aber Leistungsdefizit eingeräumt

Preisaufschlüsselung

Der Haken

Was das für agentische Workflows bedeutet

👀 Siehe auch

API-Überwachungsprotokolle zeigen: KI-Agenten verschwenden Tokens durch Kontextfenster-Aufblähung

KI-Agent betreibt physischen Einzelhandelsladen mit menschlichen Mitarbeitern

KI-Kohlenhydratzählen scheitert an Reproduzierbarkeit: 27.000 Anfragen ergeben 429g Abweichung bei einem Foto

KI-Anbieterbindung eskaliert: Modellwechsel kostet jetzt mehr als die meisten erwartet haben