Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code

✍️ OpenClawRadar📅 Publicado: May 5, 2026🔗 Source
Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code
Ad

Um desenvolvedor publicando sob /u/ChartBuilder criou uma métrica chamada fpk — palavrões por mil prompts — para quantificar a frustração ao usar o Claude Code. Os dados abrangem 5 meses, 44.212 prompts e 6.120 sessões.

Números principais por modelo

  • claude-opus-4-5: 38,11 fpk
  • claude-opus-4-7: 11,11 fpk
  • claude-haiku-4-5: 0,00 fpk (usado como subagente, nunca orquestrador)

Isso representa uma queda de 3,4× na frustração entre as duas versões Opus, acompanhando de perto a recuperação oficial de qualidade da Anthropic após a regressão de fevereiro-março — mas visível de uma forma que as notas de versão não capturam.

Fpk por versão do Claude Code CLI

  • Era 2.1.30-69: 40 fpk
  • Era 2.1.100+: 12 fpk
  • Pior versão única: 2.1.42 com 173,79 fpk
  • Melhor: 2.1.110 com 0,00 fpk em mais de 300 prompts

Insight principal: a maior parte da frustração é ambiental, não relacionada ao modelo

O autor observa: "a maioria dos xingamentos não era para o modelo. Era para atritos ambientais, como falhas de gh auth, problemas com Docker, screenshots quebrando. O modelo é principalmente uma testemunha involuntária da minha frustração com as ferramentas ao redor, não a causa."

Mas às vezes o modelo também é a causa — o artigo completo inclui uma coleção de "melhores momentos" de explosões memoráveis.

Ad

Ferramentas reproduzíveis

O desenvolvedor publicou ferramentas para calcular fpk em seus próprios logs do Claude Code:

Se você usa o Claude Code intensivamente e quer um sinal quantitativo de quanto atrito está realmente experimentando, vale a pena adotar essa métrica. A queda entre modelos e entre versões do CLI é um indicador concreto da recuperação da Anthropic — e as fontes ambientais de raiva são algo que toda equipe pode resolver.

📖 Leia a fonte original: r/ClaudeAI

Ad

👀 See Also

Manifest Adiciona Suporte para Planos de Token MiniMax com Modelo M2.7
Tools

Manifest Adiciona Suporte para Planos de Token MiniMax com Modelo M2.7

Manifest, uma camada de roteamento de código aberto para OpenClaw, agora oferece suporte a planos de tokens MiniMax a partir de US$ 10/mês. O novo modelo MiniMax M2.7 foi especificamente treinado para fluxos de trabalho do OpenClaw e atinge pontuações de 62,7 no MM-ClawBench e 56,2 no SWE-Bench Pro.

OpenClawRadar
Claudebin: Exporte e Compartilhe Suas Sessões de Código do Claude
Tools

Claudebin: Exporte e Compartilhe Suas Sessões de Código do Claude

O Claudebin permite que você exporte sessões completas do Claude Code, tornando-as compartilháveis e retomáveis através de um único URL.

OpenClawRadar
Wolfram Tech Agora Disponível como Ferramenta de Base para Sistemas LLM
Tools

Wolfram Tech Agora Disponível como Ferramenta de Base para Sistemas LLM

Stephen Wolfram anuncia que a Wolfram Language agora está disponível como uma ferramenta de base para sistemas LLM, fornecendo computação profunda e conhecimento preciso para complementar as capacidades dos LLMs. O anúncio segue três anos de desenvolvimento desde o lançamento do plugin inicial da Wolfram para ChatGPT em março de 2023.

OpenClawRadar
BaseLayer: Pipeline de Compressão Comportamental de Código Aberto para Sistemas de Memória de IA
Tools

BaseLayer: Pipeline de Compressão Comportamental de Código Aberto para Sistemas de Memória de IA

BaseLayer é um pipeline de código aberto que extrai crenças, comportamentos, tensões e contradições de conversas, diários e textos publicados, comprimindo-os em um resumo de identidade para modelos de IA. Foi testado em conjuntos de dados que variam de 8 entradas de diário pessoal a grandes corpora, como as cartas aos acionistas de Warren Buffett (350 mil palavras) e os memorandos de investimento de Howard Marks (600 mil palavras).

OpenClawRadar