Prompt 'homem das cavernas' vs 'seja breve': avaliando prompts de compressão para Claude

Um desenvolvedor comparou o caveman (o popular prompt de compressão abreviada) com o simples prompt 'seja breve.' para ver se a complexidade extra realmente compensa. O teste executou 24 prompts de desenvolvimento em 6 categorias, comparando 5 braços: linha de base, 'seja breve.', caveman lite, caveman full e caveman ultra. As saídas foram avaliadas por uma instância separada do Claude usando rubricas por prompt.
Resultados do benchmark
- Linha de base: pontuação média 0,985, tokens médios 636
- 'seja breve.': pontuação média 0,985, tokens médios 419
- Caveman lite: pontuação média 0,976, tokens médios 401
- Caveman full: pontuação média 0,975, tokens médios 404
- Caveman ultra: pontuação média 0,970, tokens médios 449
A versão de duas palavras igualou o caveman tanto em compressão quanto em qualidade. No entanto, o valor do caveman está em outros aspectos: estrutura de saída consistente, alternância de modos e o escape de segurança em operações destrutivas. O escape de segurança, na verdade, introduziu variância significativa na qualidade da saída, o que pode ser uma preocupação para certos casos de uso.
A análise completa com dados por categoria e descobertas de variância em questões de segurança está disponível no site do autor. O harness do benchmark é open source no GitHub.
📖 Leia a fonte original: r/ClaudeAI
👀 See Also

Atualizações de Abril do OpenClaw: Um Mês de Mudanças Drásticas e Confiança Abalada
As atualizações de abril do OpenClaw mostram um padrão: novos recursos e correções junto com bugs críticos. Scripts pós-instalação deletando arquivos, falhas de segurança e habilidades quebradas corroem a confiança.

Investigação de Bug do ACP: Incompatibilidade de Protocolo Causa Erro 'metadata is missing' com Ollama Local
Um bug confirmado na integração ACP/OpenClaw impede que os comandos de spawn do acpx funcionem com modelos locais do Ollama devido a uma incompatibilidade de protocolo, onde o acpx espera JSON mas recebe saída de texto.
FairyFuse alcança aceleração de kernel de 29,6x em CPUs através de inferência livre de multiplicação de pesos ternários
FairyFuse funde oito sub-GEMVs de valor real em um único loop AVX-512 usando adições/subtrações mascaradas, resultando em 32,4 tokens/s no Xeon 8558P e um ganho de 1,24x em relação ao llama.cpp Q4_K_M com qualidade quase sem perdas.

MiniMax Lança MaxClaw: Agente de IA Hospedado na Nuvem Baseado no OpenClaw
A MiniMax lançou o MaxClaw, um agente de IA totalmente gerenciado e hospedado na nuvem, construído sobre o framework OpenClaw. Ele é implantado em 10 segundos, sem necessidade de Docker ou servidores, e apresenta o modelo MiniMax M2.5 com 229 bilhões de parâmetros, contexto de 200 mil a 1 milhão de tokens e velocidade de inferência de até 100 tokens/s.