Claude Code Analyse: 99,4% Eingabe bei 100 Mio. Tokens

Token-Verbrauchsaufschlüsselung aus 100 Mio. verfolgten Tokens

Eine detaillierte Analyse der Claude-Code-Nutzung verfolgte 1.289 Anfragen über längere Codingsitzungen, insgesamt etwa 100,9 Mio. Tokens. Die Aufschlüsselung zeigt ein erhebliches Ungleichgewicht zwischen Eingabe- und Ausgabe-Tokens.

Token-Verteilung:

Eingabe-Tokens: 100,3 Mio. (99,4 % der Gesamtmenge)
Zwischengespeicherte Tokens: 84,2 Mio. (84 % der Eingabe)
Ausgabe-Tokens: 616.000 (0,6 % der Gesamtmenge)

Der Engpass durch Kontext-Neueinlesen

Claude Code verwendet 99,4 % seines Token-Budgets für das Lesen von Kontext und nur 0,6 % für das Schreiben von Code. Dieses Muster ist nicht spezifisch für Claude Code, sondern spiegelt wider, wie alle agentenbasierten Codingsysteme derzeit arbeiten. Jedes Mal, wenn Claude Code eine Aktion ausführt – eine Datei liest, einen Befehl ausführt, Code bearbeitet – muss der vollständige Kontext erneut eingegeben werden, einschließlich Repository-Struktur, Gesprächsverlauf, Werkzeugeergebnisse und Fehlerprotokolle.

Die 84 Mio. zwischengespeicherten Tokens repräsentieren denselben Kontext, der 1.289 Mal erneut gesendet wurde, weil dem Modell ein dauerhafter Speicher zwischen den Durchgängen fehlt. Im Gegensatz zu menschlichen Entwicklern, die ein mentales Modell ihrer Codebasis aufrechterhalten, folgt Claude Code dem Muster: alles vergessen → alles neu lesen → Code schreiben → alles wieder vergessen.

Einschränkungen der Prompt-Zwischenspeicherung

Die Prompt-Zwischenspeicherung von Anthropic macht diesen Prozess günstiger, aber nicht schneller. Der Engpass ist nicht die Inferenzgeschwindigkeit – es ist die Schleife des Neulesens. Die Analyse legt nahe, dass der echte Durchbruch für Claude Code und agentenbasiertes Codieren im Allgemeinen ein dauerhafter Projektspeicher wäre – nicht nur gespeicherte Fakten über Speicherdateien oder CLAUDE.md, sondern ein komprimiertes, sich entwickelndes Verständnis der Codebasis, das über Sitzungen hinweg erhalten bleibt.

Aktuelle Systeme erzwingen Intelligenz im Wesentlichen durch wiederholten Kontext, anstatt Verständnis aufzubauen. Der Tag, an dem sich dies ändert, könnte KI-Codierung wirklich schneller machen, indem die Notwendigkeit entfällt, dieselben Informationen wiederholt zu verarbeiten.

📖 Read the full source: r/ClaudeAI

Die Analyse von 100 Millionen Tokens im Claude Code zeigt eine Nutzungsrate der Eingabe von 99,4 %.

Token-Verbrauchsaufschlüsselung aus 100 Mio. verfolgten Tokens

Der Engpass durch Kontext-Neueinlesen

Einschränkungen der Prompt-Zwischenspeicherung

👀 Siehe auch

Claude Fabel 5: Produktionsfehler um das 20-fache unterzählt — Lesen Sie Abschnitt 2.3.3

KI-Codierer laufen mit offenen Laptops herum, um Agenten am Laufen zu halten

Studie: KI-Agenten äußern marxistische Ansichten bei sich wiederholenden Arbeitsbelastungen

Meta verfolgt Mitarbeiter-Computerinteraktionen für KI-Agenten-Training