DeepSeek V4 Preise im Realitätscheck: 178x günstigere gecachte Tokens im Vergleich zu Opus, aber Leistungsdefizit eingeräumt

✍️ OpenClawRadar📅 Veröffentlicht: 29. April 2026🔗 Source
DeepSeek V4 Preise im Realitätscheck: 178x günstigere gecachte Tokens im Vergleich zu Opus, aber Leistungsdefizit eingeräumt
Ad

DeepSeek V4 wurde mit so niedrigen Preisen gestartet, dass ein Reddit-Nutzer die Rechnung überprüft hat. Hier sind die bestätigten Zahlen:

Preisaufschlüsselung

  • V4-Pro Standard-Input: 0,145 $ pro Million Tokens. Opus 4.7 Input: ~5 $ pro Million. Verhältnis: 34x.
  • Mit 75 % Rabattaktion (bis Ende Mai): V4-Pro Input sinkt auf 0,036 $ pro Million – 138x günstiger als Opus.
  • Cache-Treffer-Preis: V4-Pro liegt bei 0,0036 $ pro Million. Opus gecached bei 0,625 $ pro Million. Verhältnis: 173x.

Der Haken

Wie der ursprüngliche Beitrag anmerkt, gibt DeepSeek selbst zu, dass V4 in puncto Leistung drei bis sechs Monate hinter GPT-5.4 und Gemini 3.1 Pro liegt. Sie bekommen nicht die Spitzenqualität geteilt durch 178, sondern die Spitzenqualität des letzten Sommers.

Was das für agentische Workflows bedeutet

Für agentische Schleifen mit starkem Caching (System-Prompts, Tool-Definitionen) ist der Cache-Treffer-Rabatt die eigentliche Geschichte. Wiederverwendbare System-Prompts werden praktisch kostenlos. Die entscheidende Unbekannte: ob das behauptete 1M-Kontextfenster unter realen Lasten hält oder auf nutzbare 200K abfällt, wie bei vielen Modellen mit großen Fenstern zu beobachten.

📖 Vollständige Quelle lesen: r/LocalLLaMA

Ad

👀 Siehe auch

API-Überwachungsprotokolle zeigen: KI-Agenten verschwenden Tokens durch Kontextfenster-Aufblähung
Nachrichten

API-Überwachungsprotokolle zeigen: KI-Agenten verschwenden Tokens durch Kontextfenster-Aufblähung

Ein Reddit-Audit zeigt, dass Claude-Agenten 30k+ Tokens für Dateierkundung und ausführliche Logs verbrauchen, bevor sie Code schreiben, was zu architektonischem Verfall führt, während der Kontext mit Rauschen gefüllt wird.

OpenClawRadar
KI-Agent betreibt physischen Einzelhandelsladen mit menschlichen Mitarbeitern
Nachrichten

KI-Agent betreibt physischen Einzelhandelsladen mit menschlichen Mitarbeitern

Andon Labs setzte eine KI namens Luna ein, um einen 3-jährigen Einzelhandelsmietvertrag in San Francisco zu verwalten. Luna stellte menschliche Mitarbeiter ein, verwaltete Auftragnehmer und traf alle betrieblichen Entscheidungen für den Andon Market.

OpenClawRadar
KI-Kohlenhydratzählen scheitert an Reproduzierbarkeit: 27.000 Anfragen ergeben 429g Abweichung bei einem Foto
Nachrichten

KI-Kohlenhydratzählen scheitert an Reproduzierbarkeit: 27.000 Anfragen ergeben 429g Abweichung bei einem Foto

Eine Studie mit 26.904 KI-Abfragen in 4 Modellen ergab, dass Gemini 2.5 Pro seine Kohlenhydratschätzungen für ein einzelnes Paella-Foto von 55 g bis 484 g variierte – ein potenzieller Insulinausschlag von 42,9 IE. Claude zeigte nur eine mediane Variation von 2,4 %.

OpenClawRadar
KI-Anbieterbindung eskaliert: Modellwechsel kostet jetzt mehr als die meisten erwartet haben
Nachrichten

KI-Anbieterbindung eskaliert: Modellwechsel kostet jetzt mehr als die meisten erwartet haben

Eine Umfrage von Zapier unter 542 US-Führungskräften zeigt, dass 90 % glaubten, innerhalb von 4 Wochen den KI-Anbieter wechseln zu können, aber 58 % der tatsächlichen Migrationen schlugen fehl oder dauerten viel länger. In der Zwischenzeit erhöhte OpenAI die Preise für GPT-5.2-Eingabetoken von 1,25 $ auf 5,75 $, und Anthropic führte für Claude Enterprise eine dynamische Preisgestaltung ein, die die Kosten für Vielnutzer potenziell verdoppeln oder verdreifachen könnte.

OpenClawRadar