Opus 4.7 トークン効率比較: ドイツ語は英語の2倍消費

Claude のトークナイザーには既知の言語バイアスがあり、最近の r/ClaudeAI への投稿では、Opus 4.7 モデルで英語以外の言語を使用した場合の実際の影響が示されています。

問題点

ある Pro 加入者が、まず英語、次にドイツ語で株式分析プロンプト（The Trade Desk、Coreweave、Cloudflare の予測）を実行しました。結果は次の通りです。

英語（Opus 4.7 Extended）: セッショントークンの 37% を消費
英語（Opus 4.6）: 33%
英語（Sonnet）: 約 28%
ドイツ語（Opus 4.7）: 数秒で 100%

同じモデルで同じプロンプトをドイツ語で使用すると、セッション制限がほぼ瞬時に使い果たされました。

原因

Claude はテキストをトークン化します。英語では平均して 0.75 語あたり約 1 トークンですが、ドイツ語では 0.5 語あたり約 1 トークンで、場合によってはさらに悪化します。Aktienmarktanalyse のような複合名詞は stock market analysis よりも多くのトークンに分割され、ウムラウトとトレーニングデータのカバレッジの低さがトークン数をさらに増加させます。同じ意味内容であれば、ドイツ語のプロンプトと応答は英語の 1.5 倍から 2 倍のトークンを消費します。

回避策

モデル自体が 2 つの緩和策を提案しています。

プロンプトはドイツ語で書くが、応答は英語で依頼する — 例えば、スプレッドシートのラベルは英語のまま、会話はドイツ語で続ける
モデルに 簡潔に 回答するよう依頼し、出力トークン数を減らす

Anthropic は多言語トークンコストの問題を認識していますが、これはトークナイザーの構造的特性であり、クライアント側で修正できるものではありません。

まとめ

Claude を英語以外の言語で使用していてセッション制限に達している場合、これが原因である可能性が高いです。負荷の高いワークフロー（ツールコール、ウェブ検索、長い出力）では、出力を英語に切り替えてトークンを節約することを検討してください。

📖 出典全文: r/ClaudeAI

Opus 4.7 トークン効率: ドイツ語プロンプトは英語の最大2倍のトークンを消費

問題点

原因

回避策

まとめ

👀 See Also

AIを禁止する代わりに、教授が学生と授業の契約書を作成

Claude Codeは単なるAIコードチャットからエンジニアリングOSへと進化中

Claude Security 公開ベータ版：コードベースをスキャン、自身の調査結果を検証、パッチを提案

AIに対する国民の反発は現実のもの：暴力、世論調査データ、そして収穫逓減