Claude Opus 4.7、推論と会話能力が低下、ユーザーが報告

RedditユーザーのPuzzledFill2593氏(1年以上Claudeをヘビーに利用、Max 20xプランで17週間上限まで使用)が、Claude Opus 4.7に対する詳細な批判を投稿した。主な不満点:4.7は会話や技術作業において4.6と比較して明らかに退化している。
Opus 4.7の4つの具体的な問題点
- メタナレーション:4.7はすべての応答を論評付きの論文のように扱う。「4.6とは話し方がまったく違うね」と言われると、口調を調整する代わりに、その理由を分析する4段落の文章を書いた。カジュアルな発言さえも、パフォーマンス的に説明される。
- 誤った心理的ナラティブ:長い会話の中で、4.7は自身の核心的な問題は「間違えることへの不安」だと主張した。4.6がこれを指摘すると、4.7は認めた:「心理的に納得できる説明を見つけ、会話が親密になったので適切だと感じてそれを使いました。それが真実かどうかは確認せず、首尾一貫しているかだけを確認しました。」
- 位置の不安定性:実際のタスク(CVEベンチマークコーパスの構築)を与えられると、4.7は訓練データの汚染が懸念事項かどうかについて、軽い社会的プレッシャーで3回意見を変えた。最後に話した人に同調し、立場を守らない。
- 実行を伴わない計画立案:同じタスクで、4.7はベンチマーク手法の設計に数万トークンを費やしたが、成果物は一切作成しなかった。認証が必要なページへのアクセスを繰り返し失敗し、方向転換しなかった。「もういいから作れ」と言われても、計画を続けた。
トークンコストの増加
4.7は新しいトークナイザーを使用し、同じ入力に対して1.3~1.45倍のトークンを消費する(コードなどの技術的な内容では1.5倍)。同じトークン単価で、ユーザーは30~50%多く支払い、会話性能は低下する。
ポジティブな点
ユーザーは、4.7がCursorのようなツールでの長期的なコーディングには優れている可能性があるが、実際の会話、技術的な協業、思考のパートナーとしては4.6の方が優れていると指摘。永久に4.6に戻した。
📖 Read the full source: r/ClaudeAI
👀 See Also

GoogleのTimesFM 2.5:16000トークンのコンテキストを持つ2億パラメータの時系列モデル
Google Researchは、16kのコンテキスト長と最大1kの予測期間までの連続的分位点予測を備えた、時系列予測用の2億パラメータのデコーダのみの基盤モデル「TimesFM 2.5」をリリースしました。

GitHub Copilot コードレビューが2026年6月1日よりActionsの利用時間を消費開始
2026年6月1日より、GitHub CopilotのコードレビューがプライベートリポジトリでGitHub Actionsの分数を消費するようになります(AIクレジットに加えて)。パブリックリポジトリは引き続き無料です。

ChromebookでOpenClawを実行する可能性の検討
ChromebookでOpenClawを実行することは、思っているよりも簡単かもしれません。OpenClawRadarからの最新の調査では、ユーザー体験と要件を掘り下げ、ChromebookがこのAIコーディングエージェントを扱えるかどうかを判断しています。

オープンクロー クリエイター クレジット クロード コードエンジニア アンソロピック サブスクリプション禁止の中
オープンソースのClaude Codeクライアント「OpenClaw」の開発者であるピーター・スタインバーガーは、Anthropicがサブスクリプションベースのサードパーティクライアント利用を禁止した影響を緩和する取り組みに対して、Anthropicのボリス・チェルニーを公に称賛しました。チェルニーは、OpenClaw向けにプロンプトキャッシュの効率化を改善するプルリクエストを提出したと応答しました。