Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code

Um desenvolvedor publicando sob /u/ChartBuilder criou uma métrica chamada fpk — palavrões por mil prompts — para quantificar a frustração ao usar o Claude Code. Os dados abrangem 5 meses, 44.212 prompts e 6.120 sessões.
Números principais por modelo
- claude-opus-4-5: 38,11 fpk
- claude-opus-4-7: 11,11 fpk
- claude-haiku-4-5: 0,00 fpk (usado como subagente, nunca orquestrador)
Isso representa uma queda de 3,4× na frustração entre as duas versões Opus, acompanhando de perto a recuperação oficial de qualidade da Anthropic após a regressão de fevereiro-março — mas visível de uma forma que as notas de versão não capturam.
Fpk por versão do Claude Code CLI
- Era 2.1.30-69: 40 fpk
- Era 2.1.100+: 12 fpk
- Pior versão única: 2.1.42 com 173,79 fpk
- Melhor: 2.1.110 com 0,00 fpk em mais de 300 prompts
Insight principal: a maior parte da frustração é ambiental, não relacionada ao modelo
O autor observa: "a maioria dos xingamentos não era para o modelo. Era para atritos ambientais, como falhas de gh auth, problemas com Docker, screenshots quebrando. O modelo é principalmente uma testemunha involuntária da minha frustração com as ferramentas ao redor, não a causa."
Mas às vezes o modelo também é a causa — o artigo completo inclui uma coleção de "melhores momentos" de explosões memoráveis.
Ferramentas reproduzíveis
O desenvolvedor publicou ferramentas para calcular fpk em seus próprios logs do Claude Code:
- Artigo completo com metodologia: mpiv.ai/blog/fpk-f-bombs-per-thousand-the-dev-experience-metric-you-didnt-know-you-needed
- Repositório open-source com ferramentas de auditoria: github.com/MPIsaac-Per/claude-code-ops-audit
Se você usa o Claude Code intensivamente e quer um sinal quantitativo de quanto atrito está realmente experimentando, vale a pena adotar essa métrica. A queda entre modelos e entre versões do CLI é um indicador concreto da recuperação da Anthropic — e as fontes ambientais de raiva são algo que toda equipe pode resolver.
📖 Leia a fonte original: r/ClaudeAI
👀 See Also

Manifest Adiciona Suporte para Planos de Token MiniMax com Modelo M2.7
Manifest, uma camada de roteamento de código aberto para OpenClaw, agora oferece suporte a planos de tokens MiniMax a partir de US$ 10/mês. O novo modelo MiniMax M2.7 foi especificamente treinado para fluxos de trabalho do OpenClaw e atinge pontuações de 62,7 no MM-ClawBench e 56,2 no SWE-Bench Pro.

Claudebin: Exporte e Compartilhe Suas Sessões de Código do Claude
O Claudebin permite que você exporte sessões completas do Claude Code, tornando-as compartilháveis e retomáveis através de um único URL.

Wolfram Tech Agora Disponível como Ferramenta de Base para Sistemas LLM
Stephen Wolfram anuncia que a Wolfram Language agora está disponível como uma ferramenta de base para sistemas LLM, fornecendo computação profunda e conhecimento preciso para complementar as capacidades dos LLMs. O anúncio segue três anos de desenvolvimento desde o lançamento do plugin inicial da Wolfram para ChatGPT em março de 2023.

BaseLayer: Pipeline de Compressão Comportamental de Código Aberto para Sistemas de Memória de IA
BaseLayer é um pipeline de código aberto que extrai crenças, comportamentos, tensões e contradições de conversas, diários e textos publicados, comprimindo-os em um resumo de identidade para modelos de IA. Foi testado em conjuntos de dados que variam de 8 entradas de diário pessoal a grandes corpora, como as cartas aos acionistas de Warren Buffett (350 mil palavras) e os memorandos de investimento de Howard Marks (600 mil palavras).