Claude Opus 4.8 Lançado: Modo Rápido Mais Rápido e Barato, Fluxos de Trabalho Dinâmicos e Melhorias na Honestidade

A Anthropic lançou hoje o Claude Opus 4.8, atualizando o Opus 4.7 com melhorias em benchmarks nas áreas de codificação, habilidades de agente, raciocínio e trabalho de conhecimento. A nova versão está disponível pelo mesmo preço do modelo anterior.
Principais Recursos
- Controle de esforço no claude.ai — os usuários agora podem definir quanto esforço o Claude dedica a uma tarefa.
- Workflows dinâmicos no Claude Code — permite que o modelo resolva problemas de grande escala.
- Modo rápido executa a 2,5× de velocidade e agora é três vezes mais barato que o modo rápido dos modelos anteriores.
Destaques dos Benchmarks
De acordo com o anúncio, o Claude Opus 4.8 é o único modelo a completar todos os casos de ponta a ponta no benchmark Super-Agent da Anthropic, superando os modelos Opus anteriores e o GPT-5.5 com custo equivalente. No Online-Mind2Web (tarefas de uso de computador e agente de navegador), ele obteve 84% — um salto significativo em relação ao Opus 4.7 e ao GPT-5.5. No CursorBench, ele supera os modelos Opus anteriores em todos os níveis de esforço.
No Legal Agent Benchmark, o Opus 4.8 é o primeiro modelo a ultrapassar 10% geral no padrão all-pass. Testadores iniciais também relataram melhorias na eficiência de chamadas de ferramentas (menos etapas para a mesma inteligência), precisão de citações e eficiência de tokens em workflows de recuperação.
Treinamento em Honestidade
O Opus 4.8 introduz melhorias explícitas em honestidade — o modelo é treinado para evitar alegações infundadas e sinalizar problemas com entradas/saídas proativamente. Isso resultou em análises de maior qualidade e melhor relação sinal-ruído nas avaliações dos testadores.
Precificação
O Opus 4.8 está disponível pelo mesmo preço do Opus 4.7. O preço do modo rápido é 3× mais barato que o preço anterior do modo rápido. O custo de tokens multimodais é 61% mais barato que o Opus 4.7 para o Genie (agente de IA da Databricks).
📖 Leia a fonte completa: HN AI Agents
👀 See Also

OpenAI Desenvolvendo Alternativa ao GitHub, Segundo Relatório da Reuters
A Reuters relata que a OpenAI está desenvolvendo uma alternativa ao GitHub da Microsoft, com a história gerando 35 pontos e 12 comentários no Hacker News.

GitHub Copilot muda para cobrança baseada em uso por consumo de tokens, substituindo solicitações premium em 1º de junho de 2026
GitHub Copilot faz a transição de unidades de requisição premium para créditos de IA baseados em token, com preços dos planos inalterados. Todos os planos pagos incluem créditos mensais iguais ao custo da assinatura; uso adicional é cobrado nas taxas da API.

O parâmetro effort=low do Claude Opus 4.6 difere dos modos de baixo raciocínio de outros provedores
O parâmetro effort=low do Claude Opus 4.6 controla o esforço comportamental geral, não apenas a profundidade do raciocínio, diferentemente do reasoning.effort=low da OpenAI ou do thinking_level=low do Gemini. Isso fez com que os agentes fizessem menos chamadas de ferramentas, fossem menos minuciosos na verificação cruzada e ignorassem partes das instruções do sistema sobre pesquisa na web.

Plataforma Polsia Mostra Padrões Repetitivos de SaaS em Lançamentos ao Vivo de Fundadores
Polsia é uma plataforma de negócios autônoma onde os usuários descrevem seu negócio, pagam dinheiro, e ela executa autonomamente. Um cientista comportamental observou 72 horas de lançamentos ao vivo de fundadores, identificando padrões repetitivos como soluções de automação de SDR com IA e mercados internacionais subatendidos.