Verificación de precios de DeepSeek V4: 178 veces más barato en tokens cacheados frente a Opus, pero se reconoce retraso en capacidades

✍️ OpenClawRadar📅 Publicado: 29 de abril de 2026🔗 Source
Verificación de precios de DeepSeek V4: 178 veces más barato en tokens cacheados frente a Opus, pero se reconoce retraso en capacidades
Ad

DeepSeek V4 se lanzó con precios tan bajos que un usuario de Reddit verificó los cálculos. Estos son los números confirmados:

Desglose de precios

  • Entrada estándar de V4-Pro: $0.145 por millón de tokens. Entrada de Opus 4.7: ~$5 por millón. Proporción: 34x.
  • Con un 75% de descuento promocional (hasta finales de mayo): la entrada de V4-Pro baja a $0.036 por millón, 138 veces más barato que Opus.
  • Precio de acierto de caché: V4-Pro es $0.0036 por millón. Opus en caché es $0.625 por millón. Proporción: 173x.

El inconveniente

Como señala la publicación original, DeepSeek admite que V4 está tres a seis meses por detrás de GPT-5.4 y Gemini 3.1 Pro en capacidad. No obtienes calidad de frontera a un precio de frontera dividido por 178, sino la calidad de frontera del verano pasado.

Ad

Lo que esto significa para flujos de trabajo agentivos

Para bucles agentivos con mucho caché (prompts de sistema, definiciones de herramientas), el descuento por acierto de caché es la verdadera historia. Los prompts de sistema reutilizables se vuelven esencialmente gratuitos. La incógnita clave: si la ventana de contexto declarada de 1M se mantiene bajo cargas de trabajo reales o se degrada a unos 200K utilizables, como se ha visto en muchos modelos con ventanas grandes.

📖 Lee la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Claude Corps: la Beca Nacional de $150 millones de Anthropic para la IA sin fines de lucro
Noticias

Claude Corps: la Beca Nacional de $150 millones de Anthropic para la IA sin fines de lucro

Anthropic lanza Claude Corps, una beca de 12 meses que coloca a 1.000 becarios al inicio de su carrera en organizaciones sin fines de lucro para construir herramientas de IA con Claude. Presupuesto de $150M, salario de $85k, mentoría experta.

OpenClawRadar
Análisis de 100 millones de tokens en Claude Code revela un uso del 99.4% en entradas.
Noticias

Análisis de 100 millones de tokens en Claude Code revela un uso del 99.4% en entradas.

El análisis de 1,289 solicitudes en sesiones de codificación extendidas muestra que Claude Code utilizó 100.3M tokens de entrada (99.4%) frente a solo 616K tokens de salida (0.6%), con 84.2M tokens almacenados en caché debido al reenvío repetido del contexto.

OpenClawRadar
Investigación de Errores de ACP: Desajuste de Protocolo Provoca el Error 'metadata is missing' con Ollama Local
Noticias

Investigación de Errores de ACP: Desajuste de Protocolo Provoca el Error 'metadata is missing' con Ollama Local

Un error confirmado en la integración ACP/OpenClaw impide que los comandos de generación acpx funcionen con modelos locales de Ollama debido a una incompatibilidad de protocolo donde acpx espera JSON pero recibe salida de texto.

OpenClawRadar
Claude-Code v2.1.94 agrega compatibilidad con Mantle y corrige errores críticos.
Noticias

Claude-Code v2.1.94 agrega compatibilidad con Mantle y corrige errores críticos.

Claude-Code v2.1.94 introduce soporte para Amazon Bedrock a través de Mantle con la variable de entorno CLAUDE_CODE_USE_MANTLE=1, cambia el nivel de esfuerzo predeterminado a alto para la mayoría de usuarios, y corrige más de 15 errores incluyendo manejo de límites de tasa, problemas de inicio de sesión en macOS y fallos del sistema de complementos.

OpenClawRadar