Opus 4.7 quebrou 40% dos prompts; a correção foi estruturar CLAUDE.md e Skills

Quando o Opus 4.7 foi lançado em abril, cerca de 40% dos prompts em 6 configurações de empresas de médio porte quebraram da noite para o dia. O consumo de tokens aumentou, as saídas ficaram estranhamente literais — o 4.6 costumava preencher instruções ambíguas, mas o 4.7 não. A solução não foi reescrever prompts; foi finalmente levar a sério o CLAUDE.md e os arquivos Skill.
O que quebrou e por quê
Os prompts escritos para o 4.6 assumiam que o modelo seria benevolente com instruções vagas. O 4.7 as interpretou literalmente, gerando saídas que precisavam de 3 a 4 iterações para serem corrigidas. Os prompts que sobreviveram foram aqueles incorporados em arquivos Skill com formatos de saída explícitos, limites de tamanho e exemplos práticos.
A abordagem de reconstrução
Nas 6 configurações, três mudanças estruturais foram feitas:
- Skills substituíram prompts independentes — qualquer coisa feita mais de 3 vezes ganhou um arquivo Skill (50–200 linhas) com público-alvo, formato de saída, tamanho e um exemplo prático de 2 a 3 frases. Skills são carregados sob demanda, em vez de inchar o contexto.
- CLAUDE.md hierárquico — um arquivo global para identidade do usuário, negócio, regras de tom; um CLAUDE.md por projeto; instruções de sessão para atividades pontuais. O modelo lê em ordem e constrói um modelo mental que persiste entre sessões.
- Arquivos de memória separados — manteve o CLAUDE.md com menos de 400 linhas; conhecimento institucional detalhado fica em arquivos separados que o CLAUDE.md referencia, carregados sob demanda.
- Etapa de verificação em Skills longos — o modelo gera a saída, verifica contra uma lista de 5 a 7 itens e revisa. Adiciona 30s por chamada, mas reduziu a retrabalho downstream em ~70%.
Resultados após 3 semanas
- A média de prompt até saída aceitável caiu de 3-4 iterações para 1-2.
- O uso de tokens caiu 22% nos workspaces.
- A taxa de "Esta saída está estranha, vou tentar de novo" caiu de uma vez a cada 4 prompts para uma vez a cada 15.
- O próximo lançamento de modelo agora deve ser um ganho líquido, não uma perda.
Ainda não resolvido: versionamento do CLAUDE.md
Os arquivos de projeto estão no git, mas o CLAUDE.md global vive no histórico do chat, o que é frágil. Ainda não há mecanismo de reversão.
Modelo mental
O modelo é o motor. Skills + CLAUDE.md + memória é o carro. Construa o carro uma vez; cada novo motor o torna mais rápido.
📖 Leia a fonte original: r/ClaudeAI
👀 See Also

Sopa Única, Prato Único: Um Princípio Culinário Japonês para a Fadiga de IA
Takuya aplica o princípio culinário japonês 'Ichiju Issai' para combater a fadiga de IA — simplifique sua pilha de tecnologia para uma ferramenta principal e uma ferramenta secundária, como uma refeição de arroz, sopa e um prato.

Estrutura de Código do Claude que Sobreviveu a Múltiplos Projetos Reais
Um desenvolvedor compartilha uma configuração do Claude Code que se manteve em 2-3 projetos reais com múltiplas habilidades, servidores MCP e agentes. As principais descobertas incluem usar CLAUDE MD para consistência, dividir habilidades por intenção, implementar hooks e manter o uso de contexto abaixo de 60%.

Como a Memória do OpenCLAW Realmente Funciona: Corrigindo o 'Esquecimento' do Agente
Os agentes OpenCLAW não possuem memória persistente entre conversas - eles reconstroem o contexto a partir de arquivos como SOUL.md, USER.md e MEMORY.md a cada vez. Problemas comuns de 'esquecimento' surgem de sessões antigas, arquivos de memória desestruturados e armazenamento de informações importantes no histórico de chat em vez de arquivos permanentes.

Quatro modos de falha específicos do aarch64 ao executar o vLLM no Blackwell GB10 com CUDA 13.0
Um desenvolvedor encontrou quatro modos de falha específicos ao configurar o vLLM v0.7.1 com DeepSeek-R1-32B em um sistema Blackwell GB10 rodando arquitetura aarch64 com CUDA 13.0, incluindo incompatibilidades de ABI e dependências ausentes.