Opus 4.6 O Pensamento Estendido Tem Desempenho Inferior em Problemas com Diagramas de Física

Problema de Desempenho com o Modo de Pensamento Estendido
Um usuário no r/ClaudeAI relatou testar o Opus 4.6 e o Gemini 3.1 Pro em problemas de física que exigem interpretação de diagramas visuais. Os testes revelaram uma regressão específica de desempenho no Opus 4.6 ao usar o modo de pensamento estendido.
Principais Descobertas dos Testes
- Escopo do Teste: 5 problemas de física onde "uma grande parte do problema é interpretar diagramas visuais que exibem cenários"
- Opus 4.6 com Pensamento Estendido: Errou todos os 5 problemas "completamente devido a uma interpretação fundamentalmente errada do diagrama"
- Gemini 3.1 Pro: "Arrasou" em todos os 5 problemas
- Opus 4.6 sem Pensamento Estendido: Resolveu os problemas com sucesso e foi "muito mais rápido também"
O usuário descreveu isso como "um comportamento verdadeiramente estranho", já que o pensamento estendido normalmente melhora o desempenho, mas neste caso específico de interpretação de diagramas, causou falhas consistentes.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Graduados vaam discursos motivacionais de IA em formaturas: Um sinal do sentimento dos desenvolvedores
Graduados vaiaram palestrantes que promoviam entusiasmo com IA em cerimônias de formatura, refletindo uma inquietação mais ampla sobre o impacto da IA nos empregos e na sociedade.

Zumbificação da IA nas Universidades: Um Relato em Primeira Mão de Trapaças com LLMs em Faculdades de Elite
Uma análise de como os LLMs estão sistematicamente destruindo a integridade acadêmica em universidades de elite, com exemplos específicos da UChicago: lacunas de 40 pontos entre provas para casa e presenciais, alunos fotografando exames durante as provas e professores escrevendo aulas com ChatGPT.

Anthropic aumenta limites do Claude e adiciona capacidade de computação da SpaceX
A Anthropic aumentou os limites de uso do Claude e garantiu um acordo de computação com a SpaceX. A discussão no Reddit pondera se isso é apenas expansão de infraestrutura ou um movimento estratégico para tornar o Claude uma plataforma melhor para trabalho com agentes.

Claude Opus 4.6 Quebra Referências de Arquivos CLAUDE.md
Usuários relatam que o Claude Opus 4.6 não carrega mais automaticamente os arquivos referenciados no CLAUDE.md, exigindo intervenção manual para cada arquivo.