Claude Opus 4.8 Lanzado: Modo Rápido Más Rápido y Barato, Flujos de Trabajo Dinámicos y Mejoras de Honestidad

Anthropic lanzó hoy Claude Opus 4.8, una actualización de Opus 4.7 con mejoras en benchmarks en codificación, habilidades de agente, razonamiento y trabajo intelectual. La nueva versión está disponible al mismo precio que el modelo anterior.
Características principales
- Control de esfuerzo en claude.ai: los usuarios pueden establecer cuánto esfuerzo pone Claude en una tarea.
- Flujos de trabajo dinámicos en Claude Code: permite al modelo abordar problemas de muy gran escala.
- Modo rápido funciona a 2.5× de velocidad y ahora es tres veces más barato que el modo rápido de modelos anteriores.
Destacados de benchmarks
Según el anuncio, Claude Opus 4.8 es el único modelo que completa cada caso de principio a fin en el benchmark Super-Agent de Anthropic, superando a modelos Opus anteriores y a GPT-5.5 a igualdad de coste. En Online-Mind2Web (tareas de uso informático y agente navegador) obtuvo un 84%, un salto significativo tanto sobre Opus 4.7 como sobre GPT-5.5. En CursorBench, supera a modelos Opus anteriores en todos los niveles de esfuerzo.
En el Legal Agent Benchmark, Opus 4.8 es el primer modelo en superar el 10% global en el estándar de aprobación total. Los primeros evaluadores también reportaron mejoras en eficiencia de llamadas a herramientas (menos pasos para la misma inteligencia), precisión de citas y eficiencia de tokens en flujos de recuperación.
Entrenamiento en honestidad
Opus 4.8 introduce mejoras explícitas en honestidad: el modelo está entrenado para evitar afirmaciones sin respaldo y señalar problemas con las entradas/salidas de forma proactiva. Esto se tradujo en análisis de mayor calidad y mejor relación señal-ruido en las evaluaciones de los testers.
Precios
Opus 4.8 está disponible al mismo precio que Opus 4.7. El precio del modo rápido es 3× más barato que el precio anterior del modo rápido. El coste de tokens multimodales es un 61% más barato que Opus 4.7 para Genie (el agente de IA de Databricks).
📖 Lee la fuente completa: HN AI Agents
👀 Ver también

Costos por Hora en el Mundo Real para Equipos de Agentes de IA de Larga Duración
Un desarrollador comparte los costos reales por hora para equipos de agentes de IA que ejecutan sesiones de más de 5 horas con acceso completo a Linux, navegador y herramientas. Los agentes de programación cuestan $10-$60/hora, los agentes de marketing $10-$30/hora y los agentes de back-office $5-$15/hora.

Verificación de precios de DeepSeek V4: 178 veces más barato en tokens cacheados frente a Opus, pero se reconoce retraso en capacidades
Entrada de DeepSeek V4 Pro a $0.145/M tokens frente a Claude Opus 4.7 a $5/M (34 veces más barato); aciertos de caché a $0.0036/M frente a $0.625/M (173 veces más barato). La capacidad está 3-6 meses por detrás de GPT-5.4 y Gemini 3.1 Pro.

Comparación Actual de Costos de LLM: Deepseek, Qwen, MiniMax vs OpenAI
Un análisis de Reddit muestra que Deepseek-V3.2 a $0.26/$0.38 por millón de tokens es aproximadamente 10 veces más económico que GPT-4, mientras ofrece un rendimiento de clase GPT-5 en los puntos de referencia, con Qwen3.5 y MiniMax-M2.5 como alternativas competitivas a Claude y OpenAI.

Anthropic restringe las suscripciones a Claude desde plataformas de terceros como OpenClaw.
Anthropic dejará de cubrir las suscripciones de Claude para herramientas de terceros como OpenClaw a partir del 4 de abril. Los usuarios deberán habilitar el uso adicional de pago por uso facturado por separado, con un crédito único equivalente al precio de la suscripción mensual disponible hasta el 17 de abril.