Verificación de precios de DeepSeek V4: 178 veces más barato en tokens cacheados frente a Opus, pero se reconoce retraso en capacidades

DeepSeek V4 se lanzó con precios tan bajos que un usuario de Reddit verificó los cálculos. Estos son los números confirmados:
Desglose de precios
- Entrada estándar de V4-Pro: $0.145 por millón de tokens. Entrada de Opus 4.7: ~$5 por millón. Proporción: 34x.
- Con un 75% de descuento promocional (hasta finales de mayo): la entrada de V4-Pro baja a $0.036 por millón, 138 veces más barato que Opus.
- Precio de acierto de caché: V4-Pro es $0.0036 por millón. Opus en caché es $0.625 por millón. Proporción: 173x.
El inconveniente
Como señala la publicación original, DeepSeek admite que V4 está tres a seis meses por detrás de GPT-5.4 y Gemini 3.1 Pro en capacidad. No obtienes calidad de frontera a un precio de frontera dividido por 178, sino la calidad de frontera del verano pasado.
Lo que esto significa para flujos de trabajo agentivos
Para bucles agentivos con mucho caché (prompts de sistema, definiciones de herramientas), el descuento por acierto de caché es la verdadera historia. Los prompts de sistema reutilizables se vuelven esencialmente gratuitos. La incógnita clave: si la ventana de contexto declarada de 1M se mantiene bajo cargas de trabajo reales o se degrada a unos 200K utilizables, como se ha visto en muchos modelos con ventanas grandes.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

La carrera de la IA de frontera ha terminado: las redes de modelos más pequeños superan a la IA centralizada en costo y capacidad
Las redes de modelos de IA más pequeños ahora superan a todos los sistemas de IA de frontera en velocidad, precisión y costo. El artículo argumenta que las empresas de IA centralizadas no pueden recuperar el liderazgo debido al "Efecto Hydra": el ensamblaje recursivo de modelos más baratos supera a cualquier modelo individual.

Manifiesto agrega a GitHub Copilot como cuarto proveedor de IA para el enrutamiento de OpenClaw
Manifest ahora admite el enrutamiento de solicitudes de OpenClaw a través de suscripciones a GitHub Copilot, uniéndose a Anthropic, OpenAI y Minimax como proveedores disponibles. Esto permite a los desarrolladores utilizar sus planes existentes de Copilot para tareas de código a través de modelos diseñados para el desarrollo.

Kimi $19/m Actualización: Mejorando OpenClaw con Modelos Estructurados
Kimi presenta su última actualización con un precio de $19/mes, centrada en mejorar la estructuración de modelos dentro de OpenClaw. Esta actualización promete operaciones más eficientes y características de automatización mejoradas.

OneUptime añade 12,000 publicaciones de blog generadas por IA en un solo commit.
El repositorio de blog de OneUptime añadió 12,000 publicaciones generadas por IA que cubren ClickHouse, Redis, MongoDB, MySQL y otras tecnologías en un solo commit que cambió 5,012 archivos y más de 1 millón de líneas de código.