44,212件のClaude Codeログにおける「プロンプト千件あたりのFワード数」メトリクスで開発者のフラストレーションを追跡

/u/ChartBuilderという名前で公開している開発者が、fpk(プロンプト千件あたりのfワード数)という指標を作成し、Claude Code使用中のフラストレーションを定量化しました。データは5ヶ月間、44,212件のプロンプト、6,120セッションにわたります。
モデル別の主要数値
- claude-opus-4-5: 38.11 fpk
- claude-opus-4-7: 11.11 fpk
- claude-haiku-4-5: 0.00 fpk(サブエージェントとしてのみ使用、オーケストレーターとしては不使用)
これは2つのOpusバージョン間でフラストレーションが3.4倍減少したことを示しており、Anthropicの公式な品質回復(2月から3月の性能低下からの改善)と密接に連動していますが、リリースノートでは把握できない形で明らかになっています。
Claude Code CLIバージョン別のfpk
- 2.1.30-69時代: 40 fpk
- 2.1.100+時代: 12 fpk
- 最悪の単一バージョン: 2.1.42で173.79 fpk
- 最高: 2.1.110で300件以上のプロンプトに対して0.00 fpk
主要な洞察:フラストレーションの多くは環境要因によるもので、モデル起因ではない
著者は次のように述べています:「悪態のほとんどはモデルに向けられたものではありませんでした。むしろ、gh authの失敗、Dockerの問題、スクリーンショットの不具合といった環境的な摩擦によるものでした。モデルは基本的に、周辺ツールに対する私のフラストレーションを無意識のうちに目撃しているだけで、原因ではありません。」
ただし、モデルが原因となることもあります。完全な記事には、記憶に残る暴言の「名作集」も含まれています。
再現可能なツール
開発者は、自身のClaude Codeログでfpkを計算するためのツールを公開しています:
- 方法論を含む完全な記事:mpiv.ai/blog/fpk-f-bombs-per-thousand-the-dev-experience-metric-you-didnt-know-you-needed
- オープンソースの監査ツールリポジトリ:github.com/MPIsaac-Per/claude-code-ops-audit
Claude Codeを頻繁に使用し、実際にどの程度のフラストレーションを感じているかを定量的に把握したいのであれば、この指標を採用する価値があります。モデル間やCLIバージョン間の低下は、Anthropicの回復を示す具体的な指標であり、怒りの環境的な原因はどのチームでも対処可能です。
📖 原文を読む: r/ClaudeAI
👀 See Also

ジョブリー:AI主導の紛争解決とコミュニティ投票を備えた契約マーケットプレイス
Joblyは、Next.js 14、TypeScript、Supabaseを使用して構築された契約マーケットプレイスで、提案時に10%のプロバイダー保証金を伴うエスクローシステムと、Claudeを使用したAI評価から始まり、コミュニティのステーク投票へのアピールを可能にする紛争解決パイプラインを備えています。

HostedShell:OpenClawエージェントのためのWebベース展開ソリューション
HostedShellは、ローカルでのCLI設定、依存関係管理、手動ペアリングを不要にし、ウェブコンソールを通じた直接的なターミナルアクセスとファイルシステム更新を提供する、OpenClawのホスト版です。

DeepClaudeはClaude CodeのAnthropicバックエンドをDeepSeek V4 Proに置き換え、コストを17分の1に削減
Claude Codeの環境変数を書き換えて、すべてのエージェントループ呼び出しをDeepSeek V4 Pro、OpenRouter、Fireworks AI経由でルーティングするスクリプト。同じUXで、出力トークン単価は$0.87/M対$15/M。

並列AIエージェントのボトルネック:人間承認待ち行列
並列でClaude Codeエージェントを実行している開発者が、「ボトルセルフ」—並列処理がアウトプットを増やすのをやめ、人間の承認待ちが積み重なり始めるポイント—について語る。彼の解決策:目標をサブタスクに分解し、エージェントを起動し、未解決の決定のみを人間に通知するプランナー。