Prompt 'homem das cavernas' vs 'seja breve': avaliando prompts de compressão para Claude

✍️ OpenClawRadar📅 Publicado: April 29, 2026🔗 Source

Um desenvolvedor comparou o caveman (o popular prompt de compressão abreviada) com o simples prompt 'seja breve.' para ver se a complexidade extra realmente compensa. O teste executou 24 prompts de desenvolvimento em 6 categorias, comparando 5 braços: linha de base, 'seja breve.', caveman lite, caveman full e caveman ultra. As saídas foram avaliadas por uma instância separada do Claude usando rubricas por prompt.

Resultados do benchmark

Linha de base: pontuação média 0,985, tokens médios 636
'seja breve.': pontuação média 0,985, tokens médios 419
Caveman lite: pontuação média 0,976, tokens médios 401
Caveman full: pontuação média 0,975, tokens médios 404
Caveman ultra: pontuação média 0,970, tokens médios 449

A versão de duas palavras igualou o caveman tanto em compressão quanto em qualidade. No entanto, o valor do caveman está em outros aspectos: estrutura de saída consistente, alternância de modos e o escape de segurança em operações destrutivas. O escape de segurança, na verdade, introduziu variância significativa na qualidade da saída, o que pode ser uma preocupação para certos casos de uso.

A análise completa com dados por categoria e descobertas de variância em questões de segurança está disponível no site do autor. O harness do benchmark é open source no GitHub.

📖 Leia a fonte original: r/ClaudeAI

👀 See Also

News

Não Use IA para Escrever Coisas que Você Apresenta como Trabalho Próprio

James Bach argumenta contra o uso de IA para redigir qualquer conteúdo que você reivindique como seu. Ele alerta que admitir ajuda de IA desvaloriza sua reputação e trata todo esse trabalho como porcaria.

Jun 22, 2026, 12:21 PM UTC

OpenClawRadar

News

Hospitais de Nova York encerram contrato com Palantir enquanto expansão no Reino Unido enfrenta escrutínio

O sistema de hospitais públicos da cidade de Nova York não renovará seu contrato de US$ 4 milhões com a Palantir em outubro, fazendo a transição para sistemas internos. Enquanto isso, a Palantir enfrenta preocupações com a privacidade devido ao seu acordo de £ 330 milhões com o NHS e ao novo contrato de regulação financeira do Reino Unido.

Mar 27, 2026, 01:45 AM UTC

OpenClawRadar

News

Pesquisa Checkmarx: 70% dos desenvolvedores dizem que código de IA tem mais vulnerabilidades; 30% o implantam mesmo assim

70% dos desenvolvedores acreditam que o código gerado por IA tem significativamente mais vulnerabilidades, mas 30% ainda assim enviam código vulnerável para produção. A pesquisa da Checkmarx com 2.350 entrevistados também revela que 93% das organizações sofreram violações de segurança devido a aplicativos vulneráveis.

Jun 26, 2026, 12:18 AM UTC

OpenClawRadar

News

Qwen3.6 Plus Preview Disponível Gratuitamente Através do OpenRouter para OpenClaw

O modelo Qwen3.6 Plus Preview agora está acessível gratuitamente via OpenRouter para usuários do OpenClaw. A configuração requer a obtenção de chaves de API do OpenRouter e sua configuração no OpenClaw, com um prompt para definir o nível de pensamento durante o uso inicial.

Mar 31, 2026, 11:45 PM UTC

OpenClawRadar