DeepSeek V4 Flash Kostenaufschlüsselung: Cache-Trefferquote und Preisverhältnis erklärt

✍️ OpenClawRadar📅 Veröffentlicht: 7. Mai 2026🔗 Source
DeepSeek V4 Flash Kostenaufschlüsselung: Cache-Trefferquote und Preisverhältnis erklärt
Ad

Ein Reddit-Nutzer analysierte 922 agentische Aufgabenabläufe, die auf OpenClaw (mit PI-Agenten-Schleife) und OpenRouter ausgeführt wurden, und verglich DeepSeek V4 Flash mit Opus 4.7. Der Kostenunterschied ist enorm: 0,01 $ pro Aufgabe für DeepSeek gegenüber 1,52 $ für Opus, trotz ähnlicher Token-Anzahl (~962k Durchschnitt) und Tool-Aufrufen (~14 Durchschnitt). Das Preisverhältnis beträgt 0,0066x, weit unter den erwarteten 0,03x basierend allein auf den Preisen für Eingabe-Token.

Warum DeepSeek günstiger ist: Cache-Trefferquote und Lese-/Schreibpreis

Zwei Faktoren erklären die Diskrepanz:

  • Cache-Trefferquote: DeepSeek V4 Flash erreichte 97% gegenüber 87% bei Opus 4.7. Bei diesen Cache-Lese-/Schreib-Preisverhältnissen führt jeder Prozentpunkt höherer Cache-Treffer zu etwa 20% geringeren Gesamtkosten. DeepSeeks 10% Vorsprung senken die Gesamtkosten um etwa zwei Drittel.
  • Cache-Lese-/Schreib-Preisverhältnis: DeepSeeks Verhältnis beträgt 0,02 (ein Cache-Lesevorgang kostet 2% eines Cache-Fehlschreibvorgangs), während Opus bei 0,08 liegt – vergleichbar mit OpenAI, Anthropic und Gemini (0,08–0,10). Dies allein halbiert die Kosten weiter.
Ad

Wie sich das summiert

Bei ähnlichen Token- und Tool-Anzahlen pro Aufgabe betragen DeepSeeks Gesamtkosten das 0,0066-fache von Opus. Der Nutzer vermutet, dass diese Effizienzgewinne auf Infrastruktur- oder Modellebene (z. B. bessere Caching-Strategie) erzielt werden. Der genaue Mechanismus wird nicht offengelegt.

📖 Lies die vollständige Quelle: r/LocalLLaMA

Ad

👀 Siehe auch

Claude Platform auf AWS jetzt allgemein verfügbar: Native Anthropic-Erfahrung über IAM, CloudTrail und AWS-Abrechnung
Nachrichten

Claude Platform auf AWS jetzt allgemein verfügbar: Native Anthropic-Erfahrung über IAM, CloudTrail und AWS-Abrechnung

AWS kündigte die allgemeine Verfügbarkeit der Claude Platform auf AWS an, die Entwicklern den direkten Zugriff auf die native Claude-Erfahrung von Anthropic über bestehende AWS-Konten mit IAM-Authentifizierung, AWS-Abrechnung und CloudTrail-Logging ermöglicht – aber Kundendaten werden außerhalb der AWS-Sicherheitsgrenze verarbeitet.

OpenClawRadar
61 % der Menschen nutzen jetzt KI für psychische Gesundheitsunterstützung — AXA/Ipsos globale Umfrage
Nachrichten

61 % der Menschen nutzen jetzt KI für psychische Gesundheitsunterstützung — AXA/Ipsos globale Umfrage

61 % der Menschen in 18 Ländern nutzen bereits KI für psychische Gesundheitsfragen; 28 % sagen, dass KI-Empfehlungen zu schädlichem Verhalten geführt haben, so der AXA/Ipsos Mind Health Report 2026.

OpenClawRadar
GM entlässt 600 IT-Mitarbeiter und stellt KI-Ingenieure für Agenten- und Modellentwicklung ein
Nachrichten

GM entlässt 600 IT-Mitarbeiter und stellt KI-Ingenieure für Agenten- und Modellentwicklung ein

General Motors entließ 600 IT-Mitarbeiter (~10 % der Abteilung), um Arbeitskräfte mit KI-nativen Fähigkeiten einzustellen: Agentenentwicklung, Data Engineering, Cloud Engineering, Prompt Engineering.

OpenClawRadar
🦀
Nachrichten

Transformer-Sprachmodell läuft lokal auf handelsüblichem Game Boy Color

Das TinyStories-260K-Modell von Andrej Karpathy läuft auf einem handelsüblichen Game Boy Color über eine eigene ROM und nutzt INT8-Festkommaarithmetik sowie bankgeschalteten Cartridge-Speicher für Gewichte und KV-Cache.

OpenClawRadar