DeepSeek V4 Flash Kostenaufschlüsselung: Cache-Trefferquote und Preisverhältnis erklärt

Ein Reddit-Nutzer analysierte 922 agentische Aufgabenabläufe, die auf OpenClaw (mit PI-Agenten-Schleife) und OpenRouter ausgeführt wurden, und verglich DeepSeek V4 Flash mit Opus 4.7. Der Kostenunterschied ist enorm: 0,01 $ pro Aufgabe für DeepSeek gegenüber 1,52 $ für Opus, trotz ähnlicher Token-Anzahl (~962k Durchschnitt) und Tool-Aufrufen (~14 Durchschnitt). Das Preisverhältnis beträgt 0,0066x, weit unter den erwarteten 0,03x basierend allein auf den Preisen für Eingabe-Token.
Warum DeepSeek günstiger ist: Cache-Trefferquote und Lese-/Schreibpreis
Zwei Faktoren erklären die Diskrepanz:
- Cache-Trefferquote: DeepSeek V4 Flash erreichte 97% gegenüber 87% bei Opus 4.7. Bei diesen Cache-Lese-/Schreib-Preisverhältnissen führt jeder Prozentpunkt höherer Cache-Treffer zu etwa 20% geringeren Gesamtkosten. DeepSeeks 10% Vorsprung senken die Gesamtkosten um etwa zwei Drittel.
- Cache-Lese-/Schreib-Preisverhältnis: DeepSeeks Verhältnis beträgt 0,02 (ein Cache-Lesevorgang kostet 2% eines Cache-Fehlschreibvorgangs), während Opus bei 0,08 liegt – vergleichbar mit OpenAI, Anthropic und Gemini (0,08–0,10). Dies allein halbiert die Kosten weiter.
Wie sich das summiert
Bei ähnlichen Token- und Tool-Anzahlen pro Aufgabe betragen DeepSeeks Gesamtkosten das 0,0066-fache von Opus. Der Nutzer vermutet, dass diese Effizienzgewinne auf Infrastruktur- oder Modellebene (z. B. bessere Caching-Strategie) erzielt werden. Der genaue Mechanismus wird nicht offengelegt.
📖 Lies die vollständige Quelle: r/LocalLLaMA
👀 Siehe auch

Claude Platform auf AWS jetzt allgemein verfügbar: Native Anthropic-Erfahrung über IAM, CloudTrail und AWS-Abrechnung
AWS kündigte die allgemeine Verfügbarkeit der Claude Platform auf AWS an, die Entwicklern den direkten Zugriff auf die native Claude-Erfahrung von Anthropic über bestehende AWS-Konten mit IAM-Authentifizierung, AWS-Abrechnung und CloudTrail-Logging ermöglicht – aber Kundendaten werden außerhalb der AWS-Sicherheitsgrenze verarbeitet.

61 % der Menschen nutzen jetzt KI für psychische Gesundheitsunterstützung — AXA/Ipsos globale Umfrage
61 % der Menschen in 18 Ländern nutzen bereits KI für psychische Gesundheitsfragen; 28 % sagen, dass KI-Empfehlungen zu schädlichem Verhalten geführt haben, so der AXA/Ipsos Mind Health Report 2026.

GM entlässt 600 IT-Mitarbeiter und stellt KI-Ingenieure für Agenten- und Modellentwicklung ein
General Motors entließ 600 IT-Mitarbeiter (~10 % der Abteilung), um Arbeitskräfte mit KI-nativen Fähigkeiten einzustellen: Agentenentwicklung, Data Engineering, Cloud Engineering, Prompt Engineering.
Transformer-Sprachmodell läuft lokal auf handelsüblichem Game Boy Color
Das TinyStories-260K-Modell von Andrej Karpathy läuft auf einem handelsüblichen Game Boy Color über eine eigene ROM und nutzt INT8-Festkommaarithmetik sowie bankgeschalteten Cartridge-Speicher für Gewichte und KV-Cache.