Opus 4.7 Token-Effizienz: Deutsche Prompts bis zu 2x teurer

Claudes Tokenizer weist eine bekannte sprachliche Verzerrung auf, und ein aktueller Beitrag auf r/ClaudeAI zeigt die realen Auswirkungen der Verwendung von nicht-englischen Sprachen mit dem Opus 4.7-Modell.

Das Problem

Ein Pro-Abonnent führte eine Aktienanalyse-Prompt durch (Prognose für The Trade Desk, Coreweave, Cloudflare) zuerst auf Englisch, dann auf Deutsch. Ergebnisse:

Englisch (Opus 4.7 Extended): verbrauchte 37% der Session-Tokens
Englisch (Opus 4.6): 33%
Englisch (Sonnet): ~28%
Deutsch (Opus 4.7): 100% in Sekunden

Der gleiche Prompt auf Deutsch mit demselben Modell erschöpfte das gesamte Session-Limit fast sofort.

Warum das passiert

Claude tokenisiert Text. Im Englischen entspricht ein Token durchschnittlich etwa 0,75 Wörtern; im Deutschen sind es etwa 0,5 Wörter pro Token – manchmal noch weniger. Zusammengesetzte Substantive wie Aktienmarktanalyse werden in mehr Tokens zerlegt als stock market analysis, und Umlaute sowie eine geringere Abdeckung der Trainingsdaten erhöhen die Tokenanzahl. Für den gleichen semantischen Inhalt kann ein deutscher Prompt plus Antwort 1,5- bis 2-mal so viele Tokens verbrauchen wie Englisch.

Workarounds

Das Modell selbst schlägt zwei Abhilfen vor:

Auf Deutsch prompten, aber Antworten auf Englisch anfordern – z.B. bleiben Tabellenbeschriftungen auf Englisch, während die Konversation auf Deutsch geführt wird
Das Modell bitten, knapper zu antworten, um die Anzahl der ausgegebenen Tokens zu reduzieren

Anthropic ist sich des mehrsprachigen Token-Kostenproblems bewusst, aber es handelt sich um eine strukturelle Eigenschaft des Tokenizers – die nicht clientseitig gepatcht werden kann.

Fazit

Wenn Sie Claude in einer anderen Sprache als Englisch verwenden und auf Session-Limits stoßen, liegt dies wahrscheinlich daran. Für rechenintensive Workflows (Tool-Aufrufe, Websuchen, lange Ausgaben) sollten Sie in Erwägung ziehen, für die Ausgabe auf Englisch umzuschalten, um Tokens zu sparen.

📖 Lesen Sie die vollständige Quelle: r/ClaudeAI

Opus 4.7 Token-Effizienz: Deutsche Prompts verbrauchen bis zu 2x mehr Tokens als Englische

Das Problem

Warum das passiert

Workarounds

Fazit

👀 Siehe auch

Enzyklika von Papst Leo XIV. über KI: Wichtige Erkenntnisse für Entwickler

Weltweit erstes GitHub-Exklusivangebot für KI-Agenten gestartet: Begrenzte Beta für 100 Nutzer

OpenClaw: Vier kritische Probleme, die Entwickler kennen müssen

Anthropics Claude-for-Open-Source-Programm gewährt qualifizierten Maintainern kostenlosen Zugang zu Claude Max.