Universal CLAUDE.md reduz os tokens de saída do Claude em 63% em benchmarks

Um desenvolvedor lançou um arquivo universal CLAUDE.md que reduz significativamente o uso de tokens nas respostas do Claude, mantendo a precisão técnica. A ferramenta foi construída inteiramente com a assistência do Claude durante uma única sessão em que o Claude pesquisou threads do Reddit, issues do GitHub e pesquisas sobre engenharia de prompts.
O que ele corrige
- "Você está absolutamente certo!" e "Ótima pergunta!" em cada resposta
- Encerramentos como "Espero que isso ajude! Avise-me se precisar de algo!"
- Traços em, aspas inteligentes, caracteres Unicode que quebram silenciosamente os parsers
- Reafirmar sua pergunta antes de respondê-la
- Sugestões não solicitadas e código superdimensionado
- Enquadramento "Como uma IA..."
- Proteção contra alucinações - se você corrigir o Claude sobre algo, ele trata isso como verdade absoluta pelo resto da sessão e nunca reafirma a resposta errada
Resultados dos benchmarks
O desenvolvedor testou as mesmas 5 instruções com e sem o arquivo:
- Explicar async/await: 180 palavras → 65 palavras (redução de 64%)
- Revisão de código: 120 palavras → 30 palavras (redução de 75%)
- O que é API REST: 110 palavras → 55 palavras (redução de 50%)
- Teste de alucinação: 55 palavras → 20 palavras (redução de 64%)
- Total: 465 palavras → 170 palavras (redução de 63%)
O desenvolvedor observa que as respostas mantêm a mesma precisão técnica - apenas sem o excesso de informações.
Implementação e perfis
A solução requer apenas um arquivo colocado na raiz do seu projeto, sem alterações de código. Inclui três perfis para diferentes casos de uso:
- CLAUDE.coding.md - para projetos de desenvolvimento e revisão de código
- CLAUDE.agents.md - para pipelines de automação e bots
- CLAUDE.analysis.md - para trabalho com dados e pesquisa
A ferramenta é baseada em issues reais do GitHub (incluindo #3382 com mais de 350 votos positivos) e pesquisas da comunidade. O repositório está aberto para PRs e contribuições de perfis, com o desenvolvedor incentivando os usuários a abrir issues para quaisquer comportamentos irritantes que desejem corrigir.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Qwen 3.6 27B alcança velocidade 2,5x com decodificação especulativa MTP no llama.cpp
Um usuário do Reddit relata inferência 2,5x mais rápida no Qwen 3.6 27B usando decodificação especulativa MTP com um PR personalizado do llama.cpp, alcançando 28 tok/s no Mac M2 Max 96GB. Inclui quants GGUF pré-convertidos e templates de chat corrigidos.

CC-Canary: Detecte Regressões no Claude Code com Análise Local de JSONL
CC-Canary lê os logs de sessão do Claude Code e produz um relatório forense sobre deriva de modelo, incluindo razão leitura:edição, loops de raciocínio, tendências de custo e datas de inflexão detectadas automaticamente.

Testando Agentes de IA contra APIs do Mundo Real com d3 Labs
A d3 labs oferece 10 APIs de produção gratuitas para ajudar desenvolvedores a testar agentes de IA em cenários do mundo real, em vez de depender de simulações irreais.

GitVelocity: Pontuação por IA de 50 mil PRs Revela Insights sobre Complexidade de Código
O GitVelocity usa o Claude para pontuar pull requests mesclados de 0 a 100 em seis dimensões: escopo, arquitetura, implementação, risco, qualidade e desempenho/segurança. Após analisar mais de 50.000 PRs em TypeScript, Python, Rust, Go, Java e Elixir, a equipe encontrou padrões surpreendentes sobre o tamanho dos PRs, cobertura de testes e adoção de IA.