Claude Opus 4.8: Modo Rápido Mais Veloz, Workflows Dinâmicos

A Anthropic lançou hoje o Claude Opus 4.8, atualizando o Opus 4.7 com melhorias em benchmarks nas áreas de codificação, habilidades de agente, raciocínio e trabalho de conhecimento. A nova versão está disponível pelo mesmo preço do modelo anterior.

Principais Recursos

Controle de esforço no claude.ai — os usuários agora podem definir quanto esforço o Claude dedica a uma tarefa.
Workflows dinâmicos no Claude Code — permite que o modelo resolva problemas de grande escala.
Modo rápido executa a 2,5× de velocidade e agora é três vezes mais barato que o modo rápido dos modelos anteriores.

Destaques dos Benchmarks

De acordo com o anúncio, o Claude Opus 4.8 é o único modelo a completar todos os casos de ponta a ponta no benchmark Super-Agent da Anthropic, superando os modelos Opus anteriores e o GPT-5.5 com custo equivalente. No Online-Mind2Web (tarefas de uso de computador e agente de navegador), ele obteve 84% — um salto significativo em relação ao Opus 4.7 e ao GPT-5.5. No CursorBench, ele supera os modelos Opus anteriores em todos os níveis de esforço.

No Legal Agent Benchmark, o Opus 4.8 é o primeiro modelo a ultrapassar 10% geral no padrão all-pass. Testadores iniciais também relataram melhorias na eficiência de chamadas de ferramentas (menos etapas para a mesma inteligência), precisão de citações e eficiência de tokens em workflows de recuperação.

Treinamento em Honestidade

O Opus 4.8 introduz melhorias explícitas em honestidade — o modelo é treinado para evitar alegações infundadas e sinalizar problemas com entradas/saídas proativamente. Isso resultou em análises de maior qualidade e melhor relação sinal-ruído nas avaliações dos testadores.

Precificação

O Opus 4.8 está disponível pelo mesmo preço do Opus 4.7. O preço do modo rápido é 3× mais barato que o preço anterior do modo rápido. O custo de tokens multimodais é 61% mais barato que o Opus 4.7 para o Genie (agente de IA da Databricks).

📖 Leia a fonte completa: HN AI Agents

Claude Opus 4.8 Lançado: Modo Rápido Mais Rápido e Barato, Fluxos de Trabalho Dinâmicos e Melhorias na Honestidade

Principais Recursos

Destaques dos Benchmarks

Treinamento em Honestidade

Precificação

👀 See Also

Código Vazado do Claude Revela Sistema KAIROS e a Lacuna de Verificação em Agentes de IA

Ferramentas de Detecção de IA Levam Alunos a Usar IA de Forma Defensiva, Revela Estudo

Anthropic limita o OpenClaw com novo sistema de crédito: Detalhes e Impacto

API Paga do DeepSeek Usa Prompts para Treinamento — O que os Usuários do OpenClaw Precisam Saber