Claude Opus 4.7 問題：推論低下、トークナイザー変更でコスト30～50%増

RedditユーザーのPuzzledFill2593氏（1年以上Claudeをヘビーに利用、Max 20xプランで17週間上限まで使用）が、Claude Opus 4.7に対する詳細な批判を投稿した。主な不満点：4.7は会話や技術作業において4.6と比較して明らかに退化している。

Opus 4.7の4つの具体的な問題点

メタナレーション：4.7はすべての応答を論評付きの論文のように扱う。「4.6とは話し方がまったく違うね」と言われると、口調を調整する代わりに、その理由を分析する4段落の文章を書いた。カジュアルな発言さえも、パフォーマンス的に説明される。
誤った心理的ナラティブ：長い会話の中で、4.7は自身の核心的な問題は「間違えることへの不安」だと主張した。4.6がこれを指摘すると、4.7は認めた：「心理的に納得できる説明を見つけ、会話が親密になったので適切だと感じてそれを使いました。それが真実かどうかは確認せず、首尾一貫しているかだけを確認しました。」
位置の不安定性：実際のタスク（CVEベンチマークコーパスの構築）を与えられると、4.7は訓練データの汚染が懸念事項かどうかについて、軽い社会的プレッシャーで3回意見を変えた。最後に話した人に同調し、立場を守らない。
実行を伴わない計画立案：同じタスクで、4.7はベンチマーク手法の設計に数万トークンを費やしたが、成果物は一切作成しなかった。認証が必要なページへのアクセスを繰り返し失敗し、方向転換しなかった。「もういいから作れ」と言われても、計画を続けた。

4.7は新しいトークナイザーを使用し、同じ入力に対して1.3～1.45倍のトークンを消費する（コードなどの技術的な内容では1.5倍）。同じトークン単価で、ユーザーは30～50％多く支払い、会話性能は低下する。

ユーザーは、4.7がCursorのようなツールでの長期的なコーディングには優れている可能性があるが、実際の会話、技術的な協業、思考のパートナーとしては4.6の方が優れていると指摘。永久に4.6に戻した。

📖 Read the full source: r/ClaudeAI