Opus 4.7 トークン効率: ドイツ語プロンプトは英語の最大2倍のトークンを消費

Claude のトークナイザーには既知の言語バイアスがあり、最近の r/ClaudeAI への投稿では、Opus 4.7 モデルで英語以外の言語を使用した場合の実際の影響が示されています。
問題点
ある Pro 加入者が、まず英語、次にドイツ語で株式分析プロンプト(The Trade Desk、Coreweave、Cloudflare の予測)を実行しました。結果は次の通りです。
- 英語(Opus 4.7 Extended): セッショントークンの 37% を消費
- 英語(Opus 4.6): 33%
- 英語(Sonnet): 約 28%
- ドイツ語(Opus 4.7): 数秒で 100%
同じモデルで同じプロンプトをドイツ語で使用すると、セッション制限がほぼ瞬時に使い果たされました。
原因
Claude はテキストをトークン化します。英語では平均して 0.75 語あたり約 1 トークンですが、ドイツ語では 0.5 語あたり約 1 トークンで、場合によってはさらに悪化します。Aktienmarktanalyse のような複合名詞は stock market analysis よりも多くのトークンに分割され、ウムラウトとトレーニングデータのカバレッジの低さがトークン数をさらに増加させます。同じ意味内容であれば、ドイツ語のプロンプトと応答は英語の 1.5 倍から 2 倍のトークンを消費します。
回避策
モデル自体が 2 つの緩和策を提案しています。
- プロンプトはドイツ語で書くが、応答は英語で依頼する — 例えば、スプレッドシートのラベルは英語のまま、会話はドイツ語で続ける
- モデルに 簡潔に 回答するよう依頼し、出力トークン数を減らす
Anthropic は多言語トークンコストの問題を認識していますが、これはトークナイザーの構造的特性であり、クライアント側で修正できるものではありません。
まとめ
Claude を英語以外の言語で使用していてセッション制限に達している場合、これが原因である可能性が高いです。負荷の高いワークフロー(ツールコール、ウェブ検索、長い出力)では、出力を英語に切り替えてトークンを節約することを検討してください。
📖 出典全文: r/ClaudeAI
👀 See Also

AnthropicのDNS活動から、新たなSTTサービス、API RC2、およびトンネルインフラが明らかに
AnthropicのサブドメインのDNS監視により、「Titanium」プラットフォーム上の音声認識サービス、APIリリース候補2、トンネルインフラ、ステージング環境のMCPプロキシに関する新規レコードが確認されました。

Claude-Code v2.1.47 リリース:主要な修正と改善点
Claude-Code v2.1.47リリースでは、Windowsターミナルのレンダリング、ファイル処理、bashツール出力に関する重要な修正に加え、メモリとパフォーマンスの向上がもたらされています。

AMD MI50におけるQwen 3.6 27Bの52.8 tps TG:フルプレシジョン、MTPなし、量子化なし
Redditユーザーが、vllmフォークとROCm 7.2.1を使用して8枚のAMD MI50(2018年製カード)上でQwen3.6-27Bをベンチマークし、フル精度・MTPなしで52.8 tps TG、1569 tps PPを達成しました。

ラブアブルは、国際女性デーを記念して、24時間無料アクセスと350ドル分のパートナークレジットを提供します。
Lovableは、24時間の無料ビルディングアクセスに加え、AnthropicからのClaude APIトークン100ドル分とStripeの決済手数料クレジット250ドル分を提供しています。このオファーは3月9日午前0時59分に終了します。