Palavrões por Mil Prompts: Métrica de Frustração em 44.212 Logs do Claude

Um desenvolvedor publicando sob /u/ChartBuilder criou uma métrica chamada fpk — palavrões por mil prompts — para quantificar a frustração ao usar o Claude Code. Os dados abrangem 5 meses, 44.212 prompts e 6.120 sessões.

Números principais por modelo

claude-opus-4-5: 38,11 fpk
claude-opus-4-7: 11,11 fpk
claude-haiku-4-5: 0,00 fpk (usado como subagente, nunca orquestrador)

Isso representa uma queda de 3,4× na frustração entre as duas versões Opus, acompanhando de perto a recuperação oficial de qualidade da Anthropic após a regressão de fevereiro-março — mas visível de uma forma que as notas de versão não capturam.

Fpk por versão do Claude Code CLI

Era 2.1.30-69: 40 fpk
Era 2.1.100+: 12 fpk
Pior versão única: 2.1.42 com 173,79 fpk
Melhor: 2.1.110 com 0,00 fpk em mais de 300 prompts

Insight principal: a maior parte da frustração é ambiental, não relacionada ao modelo

O autor observa: "a maioria dos xingamentos não era para o modelo. Era para atritos ambientais, como falhas de gh auth, problemas com Docker, screenshots quebrando. O modelo é principalmente uma testemunha involuntária da minha frustração com as ferramentas ao redor, não a causa."

Mas às vezes o modelo também é a causa — o artigo completo inclui uma coleção de "melhores momentos" de explosões memoráveis.

Ferramentas reproduzíveis

O desenvolvedor publicou ferramentas para calcular fpk em seus próprios logs do Claude Code:

Artigo completo com metodologia: mpiv.ai/blog/fpk-f-bombs-per-thousand-the-dev-experience-metric-you-didnt-know-you-needed
Repositório open-source com ferramentas de auditoria: github.com/MPIsaac-Per/claude-code-ops-audit

Se você usa o Claude Code intensivamente e quer um sinal quantitativo de quanto atrito está realmente experimentando, vale a pena adotar essa métrica. A queda entre modelos e entre versões do CLI é um indicador concreto da recuperação da Anthropic — e as fontes ambientais de raiva são algo que toda equipe pode resolver.

📖 Leia a fonte original: r/ClaudeAI

Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code

Números principais por modelo

Fpk por versão do Claude Code CLI

Insight principal: a maior parte da frustração é ambiental, não relacionada ao modelo

Ferramentas reproduzíveis

👀 See Also

Usuários relatam valor misto do OpenClaw e ClawDBot: O que você precisa saber

Memória Relacional para LLMs: Sistema de Três Camadas Modela Relações do Usuário

Cull: Mecanismo de Curadoria de Conjuntos de Dados de Código Aberto para Pipelines de Imagens de IA

Kelet: Análise Automatizada de Causa Raiz para Agentes de IA