Claude Opus 4.8: Modo rápido más veloz, flujos dinámicos

Anthropic lanzó hoy Claude Opus 4.8, una actualización de Opus 4.7 con mejoras en benchmarks en codificación, habilidades de agente, razonamiento y trabajo intelectual. La nueva versión está disponible al mismo precio que el modelo anterior.

Características principales

Control de esfuerzo en claude.ai: los usuarios pueden establecer cuánto esfuerzo pone Claude en una tarea.
Flujos de trabajo dinámicos en Claude Code: permite al modelo abordar problemas de muy gran escala.
Modo rápido funciona a 2.5× de velocidad y ahora es tres veces más barato que el modo rápido de modelos anteriores.

Destacados de benchmarks

Según el anuncio, Claude Opus 4.8 es el único modelo que completa cada caso de principio a fin en el benchmark Super-Agent de Anthropic, superando a modelos Opus anteriores y a GPT-5.5 a igualdad de coste. En Online-Mind2Web (tareas de uso informático y agente navegador) obtuvo un 84%, un salto significativo tanto sobre Opus 4.7 como sobre GPT-5.5. En CursorBench, supera a modelos Opus anteriores en todos los niveles de esfuerzo.

En el Legal Agent Benchmark, Opus 4.8 es el primer modelo en superar el 10% global en el estándar de aprobación total. Los primeros evaluadores también reportaron mejoras en eficiencia de llamadas a herramientas (menos pasos para la misma inteligencia), precisión de citas y eficiencia de tokens en flujos de recuperación.

Entrenamiento en honestidad

Opus 4.8 introduce mejoras explícitas en honestidad: el modelo está entrenado para evitar afirmaciones sin respaldo y señalar problemas con las entradas/salidas de forma proactiva. Esto se tradujo en análisis de mayor calidad y mejor relación señal-ruido en las evaluaciones de los testers.

Precios

Opus 4.8 está disponible al mismo precio que Opus 4.7. El precio del modo rápido es 3× más barato que el precio anterior del modo rápido. El coste de tokens multimodales es un 61% más barato que Opus 4.7 para Genie (el agente de IA de Databricks).

📖 Lee la fuente completa: HN AI Agents

Claude Opus 4.8 Lanzado: Modo Rápido Más Rápido y Barato, Flujos de Trabajo Dinámicos y Mejoras de Honestidad

Características principales

Destacados de benchmarks

Entrenamiento en honestidad

Precios

👀 Ver también

Lanzado Claude Code v2.1.37

Escáner de IA analiza 400K publicaciones de Reddit y descubre efectos secundarios ocultos de Ozempic como cambios menstruales

El costo oculto del código generado por IA: depurar espagueti

Usuarios de Docker de OpenClaw: actualización 2026.3.13 sin etiquetas de Docker