Analyse des prix de DeepSeek V4 : tokens en cache 178x moins chers qu'Opus, mais retard de capacités reconnu

✍️ OpenClawRadar📅 Publié: April 29, 2026🔗 Source
Analyse des prix de DeepSeek V4 : tokens en cache 178x moins chers qu'Opus, mais retard de capacités reconnu
Ad

DeepSeek V4 a été lancé avec des tarifs si bas qu'un utilisateur de Reddit a vérifié les calculs. Voici les chiffres confirmés :

Détail des prix

  • Entrée standard V4-Pro : 0,145 $ par million de tokens. Entrée Opus 4.7 : ~5 $ par million. Rapport : 34x.
  • Avec 75 % de réduction promotionnelle (jusqu'à fin mai) : l'entrée V4-Pro chute à 0,036 $ par million — 138x moins cher qu'Opus.
  • Tarifs des hits de cache : V4-Pro à 0,0036 $ par million. Opus en cache à 0,625 $ par million. Rapport : 173x.

Le hic

Comme le note le post original, DeepSeek admet que V4 a 3 à 6 mois de retard sur GPT-5.4 et Gemini 3.1 Pro en termes de capacité. Vous n'obtenez pas une qualité de pointe divisée par 178 — vous obtenez la qualité de pointe de l'été dernier.

Ad

Ce que cela signifie pour les workflows agentiques

Pour les boucles agentiques avec un cache important (prompts système, définitions d'outils), la réduction sur les hits de cache est la vraie histoire. Les prompts système réutilisables deviennent essentiellement gratuits. L'inconnue clé : savoir si la fenêtre de contexte revendiquée de 1M tient sous des charges réelles ou se dégrade à un utilisable 200K, comme on l'a vu avec de nombreux modèles à grande fenêtre.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also