Analyse des prix de DeepSeek V4 : tokens en cache 178x moins chers qu'Opus, mais retard de capacités reconnu

DeepSeek V4 a été lancé avec des tarifs si bas qu'un utilisateur de Reddit a vérifié les calculs. Voici les chiffres confirmés :
Détail des prix
- Entrée standard V4-Pro : 0,145 $ par million de tokens. Entrée Opus 4.7 : ~5 $ par million. Rapport : 34x.
- Avec 75 % de réduction promotionnelle (jusqu'à fin mai) : l'entrée V4-Pro chute à 0,036 $ par million — 138x moins cher qu'Opus.
- Tarifs des hits de cache : V4-Pro à 0,0036 $ par million. Opus en cache à 0,625 $ par million. Rapport : 173x.
Le hic
Comme le note le post original, DeepSeek admet que V4 a 3 à 6 mois de retard sur GPT-5.4 et Gemini 3.1 Pro en termes de capacité. Vous n'obtenez pas une qualité de pointe divisée par 178 — vous obtenez la qualité de pointe de l'été dernier.
Ce que cela signifie pour les workflows agentiques
Pour les boucles agentiques avec un cache important (prompts système, définitions d'outils), la réduction sur les hits de cache est la vraie histoire. Les prompts système réutilisables deviennent essentiellement gratuits. L'inconnue clé : savoir si la fenêtre de contexte revendiquée de 1M tient sous des charges réelles ou se dégrade à un utilisable 200K, comme on l'a vu avec de nombreux modèles à grande fenêtre.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Différences entre l'utilisation de Claude via GitHub Copilot et en tant qu'extension VS Code
Explorez les différences entre l'utilisation de Claude AI via les sessions cibles de GitHub Copilot et en tant qu'extension VS Code, en fonction de leur intégration et de leur fonctionnalité.

Erreurs élevées sur Claude Opus 4.7 : Mise à jour et à quoi s'attendre
Claude Opus 4.7 rencontre actuellement des erreurs élevées depuis le 2026-05-19T15:21Z. Consultez status.claude.com pour l'avancement et les résolutions.

Claude prévoit d'ajouter un crédit programmatique mensuel pour l'utilisation de l'API
Les plans Claude d'Anthropic incluront un crédit mensuel dédié à l'utilisation programmatique (API), selon un tweet de ClaudeDevs sur X.

Lovable offre un accès gratuit de 24 heures avec 350 $ de crédits partenaires pour la Journée internationale des femmes.
Lovable propose un accès gratuit à sa plateforme pendant 24 heures, plus 100 $ de crédits API Claude d'Anthropic et 250 $ de crédits pour les frais de traitement Stripe. L'offre se termine le 9 mars à 00h59.