Claude Opus 4.8 Lançado: Modo Rápido Mais Rápido e Barato, Fluxos de Trabalho Dinâmicos e Melhorias na Honestidade

✍️ OpenClawRadar📅 Publicado: May 29, 2026🔗 Source
Claude Opus 4.8 Lançado: Modo Rápido Mais Rápido e Barato, Fluxos de Trabalho Dinâmicos e Melhorias na Honestidade
Ad

A Anthropic lançou hoje o Claude Opus 4.8, atualizando o Opus 4.7 com melhorias em benchmarks nas áreas de codificação, habilidades de agente, raciocínio e trabalho de conhecimento. A nova versão está disponível pelo mesmo preço do modelo anterior.

Principais Recursos

  • Controle de esforço no claude.ai — os usuários agora podem definir quanto esforço o Claude dedica a uma tarefa.
  • Workflows dinâmicos no Claude Code — permite que o modelo resolva problemas de grande escala.
  • Modo rápido executa a 2,5× de velocidade e agora é três vezes mais barato que o modo rápido dos modelos anteriores.

Destaques dos Benchmarks

De acordo com o anúncio, o Claude Opus 4.8 é o único modelo a completar todos os casos de ponta a ponta no benchmark Super-Agent da Anthropic, superando os modelos Opus anteriores e o GPT-5.5 com custo equivalente. No Online-Mind2Web (tarefas de uso de computador e agente de navegador), ele obteve 84% — um salto significativo em relação ao Opus 4.7 e ao GPT-5.5. No CursorBench, ele supera os modelos Opus anteriores em todos os níveis de esforço.

No Legal Agent Benchmark, o Opus 4.8 é o primeiro modelo a ultrapassar 10% geral no padrão all-pass. Testadores iniciais também relataram melhorias na eficiência de chamadas de ferramentas (menos etapas para a mesma inteligência), precisão de citações e eficiência de tokens em workflows de recuperação.

Ad

Treinamento em Honestidade

O Opus 4.8 introduz melhorias explícitas em honestidade — o modelo é treinado para evitar alegações infundadas e sinalizar problemas com entradas/saídas proativamente. Isso resultou em análises de maior qualidade e melhor relação sinal-ruído nas avaliações dos testadores.

Precificação

O Opus 4.8 está disponível pelo mesmo preço do Opus 4.7. O preço do modo rápido é 3× mais barato que o preço anterior do modo rápido. O custo de tokens multimodais é 61% mais barato que o Opus 4.7 para o Genie (agente de IA da Databricks).

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

OpenAI Desenvolvendo Alternativa ao GitHub, Segundo Relatório da Reuters
News

OpenAI Desenvolvendo Alternativa ao GitHub, Segundo Relatório da Reuters

A Reuters relata que a OpenAI está desenvolvendo uma alternativa ao GitHub da Microsoft, com a história gerando 35 pontos e 12 comentários no Hacker News.

OpenClawRadar
GitHub Copilot muda para cobrança baseada em uso por consumo de tokens, substituindo solicitações premium em 1º de junho de 2026
News

GitHub Copilot muda para cobrança baseada em uso por consumo de tokens, substituindo solicitações premium em 1º de junho de 2026

GitHub Copilot faz a transição de unidades de requisição premium para créditos de IA baseados em token, com preços dos planos inalterados. Todos os planos pagos incluem créditos mensais iguais ao custo da assinatura; uso adicional é cobrado nas taxas da API.

OpenClawRadar
O parâmetro effort=low do Claude Opus 4.6 difere dos modos de baixo raciocínio de outros provedores
News

O parâmetro effort=low do Claude Opus 4.6 difere dos modos de baixo raciocínio de outros provedores

O parâmetro effort=low do Claude Opus 4.6 controla o esforço comportamental geral, não apenas a profundidade do raciocínio, diferentemente do reasoning.effort=low da OpenAI ou do thinking_level=low do Gemini. Isso fez com que os agentes fizessem menos chamadas de ferramentas, fossem menos minuciosos na verificação cruzada e ignorassem partes das instruções do sistema sobre pesquisa na web.

OpenClawRadar
Plataforma Polsia Mostra Padrões Repetitivos de SaaS em Lançamentos ao Vivo de Fundadores
News

Plataforma Polsia Mostra Padrões Repetitivos de SaaS em Lançamentos ao Vivo de Fundadores

Polsia é uma plataforma de negócios autônoma onde os usuários descrevem seu negócio, pagam dinheiro, e ela executa autonomamente. Um cientista comportamental observou 72 horas de lançamentos ao vivo de fundadores, identificando padrões repetitivos como soluções de automação de SDR com IA e mercados internacionais subatendidos.

OpenClawRadar