Opus 4.7 Token-Effizienz: Deutsche Prompts verbrauchen bis zu 2x mehr Tokens als Englische

✍️ OpenClawRadar📅 Veröffentlicht: 10. Mai 2026🔗 Source
Opus 4.7 Token-Effizienz: Deutsche Prompts verbrauchen bis zu 2x mehr Tokens als Englische
Ad

Claudes Tokenizer weist eine bekannte sprachliche Verzerrung auf, und ein aktueller Beitrag auf r/ClaudeAI zeigt die realen Auswirkungen der Verwendung von nicht-englischen Sprachen mit dem Opus 4.7-Modell.

Das Problem

Ein Pro-Abonnent führte eine Aktienanalyse-Prompt durch (Prognose für The Trade Desk, Coreweave, Cloudflare) zuerst auf Englisch, dann auf Deutsch. Ergebnisse:

  • Englisch (Opus 4.7 Extended): verbrauchte 37% der Session-Tokens
  • Englisch (Opus 4.6): 33%
  • Englisch (Sonnet): ~28%
  • Deutsch (Opus 4.7): 100% in Sekunden

Der gleiche Prompt auf Deutsch mit demselben Modell erschöpfte das gesamte Session-Limit fast sofort.

Warum das passiert

Claude tokenisiert Text. Im Englischen entspricht ein Token durchschnittlich etwa 0,75 Wörtern; im Deutschen sind es etwa 0,5 Wörter pro Token – manchmal noch weniger. Zusammengesetzte Substantive wie Aktienmarktanalyse werden in mehr Tokens zerlegt als stock market analysis, und Umlaute sowie eine geringere Abdeckung der Trainingsdaten erhöhen die Tokenanzahl. Für den gleichen semantischen Inhalt kann ein deutscher Prompt plus Antwort 1,5- bis 2-mal so viele Tokens verbrauchen wie Englisch.

Ad

Workarounds

Das Modell selbst schlägt zwei Abhilfen vor:

  • Auf Deutsch prompten, aber Antworten auf Englisch anfordern – z.B. bleiben Tabellenbeschriftungen auf Englisch, während die Konversation auf Deutsch geführt wird
  • Das Modell bitten, knapper zu antworten, um die Anzahl der ausgegebenen Tokens zu reduzieren

Anthropic ist sich des mehrsprachigen Token-Kostenproblems bewusst, aber es handelt sich um eine strukturelle Eigenschaft des Tokenizers – die nicht clientseitig gepatcht werden kann.

Fazit

Wenn Sie Claude in einer anderen Sprache als Englisch verwenden und auf Session-Limits stoßen, liegt dies wahrscheinlich daran. Für rechenintensive Workflows (Tool-Aufrufe, Websuchen, lange Ausgaben) sollten Sie in Erwägung ziehen, für die Ausgabe auf Englisch umzuschalten, um Tokens zu sparen.

📖 Lesen Sie die vollständige Quelle: r/ClaudeAI

Ad

👀 Siehe auch