Claude Sonnet 4.6 Revelado: Capacidades Aprimoradas de Programação e Uso de Computador

A Anthropic lançou o Claude Sonnet 4.6, a mais recente iteração de sua linha de modelos Sonnet, apresentando melhorias significativas em programação, uso de computador, raciocínio de contexto longo e mais. Entre seus novos recursos, destaca-se a janela de contexto de 1 milhão de tokens, atualmente em versão beta, que amplia sua capacidade de lidar com volumes substanciais de dados, como bases de código inteiras e documentos extensos.
O Sonnet 4.6 agora é o modelo padrão tanto no claude.ai quanto no Claude Cowork para usuários inscritos nos planos Gratuito e Pro, com preços a partir de US$ 3/US$ 15 por milhão de tokens, inalterados em relação ao Sonnet 4.5. Desenvolvedores com acesso antecipado observaram melhorias notáveis no seguimento de instruções, consistência e execução de tarefas, considerando o Sonnet 4.6 preferível ao Claude Opus 4.5 de novembro de 2025 para muitas tarefas do mundo real.
Em termos de habilidades de uso de computador, o Sonnet 4.6 aprimora o progresso alcançado desde o primeiro lançamento do modelo de uso geral de computador do Claude em outubro de 2024. O modelo interage com softwares como um humano, usando interfaces virtuais como mouse e teclado sem conectores especializados. Os benchmarks OSWorld, um padrão para uso de computador por IA, confirmam seu desenvolvimento, mostrando capacidades quase humanas em tarefas complexas como navegar por planilhas e preencher formulários da web.
A segurança continua sendo um foco, com o Sonnet 4.6 passando por extensas avaliações de segurança que indicam sua maior resiliência a ataques de injeção de prompt, rivalizando com os modelos da classe Opus nesse aspecto. O cartão do sistema e a documentação da API fornecem mais detalhes e orientações sobre esses aprimoramentos de segurança.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Análise do Claude Opus 4.7: Inteligência de Topo, mas Custo Elevado e Verbosidade
Claude Opus 4.7 (Raciocínio Adaptativo, Máximo Esforço) ocupa a 1ª posição em inteligência entre 133 modelos com uma pontuação de 57 no Índice de Inteligência da Artificial Analysis, mas custa US$ 5 por 1 milhão de tokens de entrada e US$ 25 por 1 milhão de tokens de saída, tornando-o significativamente mais caro que a média.

Análise de 413 Mil Execuções de Agentes de IA Revela o que os Faz Ter Sucesso
Uma análise de 413.278 execuções de agentes de engenharia de software de IA do conjunto de dados CoderForge-Preview mostra que as melhores práticas humanas de engenharia de software frequentemente prejudicam o desempenho dos agentes. Os dados revelam padrões específicos que separam execuções bem-sucedidas das falhas nos mesmos problemas.

Qwen3.5-27B Comparação de Desempenho entre 8 bits e 16 bits
Um usuário do Reddit testou o Qwen3.5-27B com vLLM comparando pesos bf16 e cache KV de 16 bits contra a quantização fp8 do Qwen com cache KV de 8 bits, encontrando resultados praticamente idênticos no benchmark Aider usando uma RTX 6000 Pro.

CEO da Mistral alerta que Europa tem uma janela de dois anos para evitar dependência de infraestrutura de IA dos EUA
O CEO da Mistral, Arthur Mensch, alerta que a Europa tem 2 anos para construir sua própria infraestrutura de IA – chips, energia, computação – ou corre o risco de se tornar um 'estado vassalo' permanente das gigantes de tecnologia dos EUA.