Die Analyse von 100 Millionen Tokens im Claude Code zeigt eine Nutzungsrate der Eingabe von 99,4 %.

Token-Verbrauchsaufschlüsselung aus 100 Mio. verfolgten Tokens
Eine detaillierte Analyse der Claude-Code-Nutzung verfolgte 1.289 Anfragen über längere Codingsitzungen, insgesamt etwa 100,9 Mio. Tokens. Die Aufschlüsselung zeigt ein erhebliches Ungleichgewicht zwischen Eingabe- und Ausgabe-Tokens.
Token-Verteilung:
- Eingabe-Tokens: 100,3 Mio. (99,4 % der Gesamtmenge)
- Zwischengespeicherte Tokens: 84,2 Mio. (84 % der Eingabe)
- Ausgabe-Tokens: 616.000 (0,6 % der Gesamtmenge)
Der Engpass durch Kontext-Neueinlesen
Claude Code verwendet 99,4 % seines Token-Budgets für das Lesen von Kontext und nur 0,6 % für das Schreiben von Code. Dieses Muster ist nicht spezifisch für Claude Code, sondern spiegelt wider, wie alle agentenbasierten Codingsysteme derzeit arbeiten. Jedes Mal, wenn Claude Code eine Aktion ausführt – eine Datei liest, einen Befehl ausführt, Code bearbeitet – muss der vollständige Kontext erneut eingegeben werden, einschließlich Repository-Struktur, Gesprächsverlauf, Werkzeugeergebnisse und Fehlerprotokolle.
Die 84 Mio. zwischengespeicherten Tokens repräsentieren denselben Kontext, der 1.289 Mal erneut gesendet wurde, weil dem Modell ein dauerhafter Speicher zwischen den Durchgängen fehlt. Im Gegensatz zu menschlichen Entwicklern, die ein mentales Modell ihrer Codebasis aufrechterhalten, folgt Claude Code dem Muster: alles vergessen → alles neu lesen → Code schreiben → alles wieder vergessen.
Einschränkungen der Prompt-Zwischenspeicherung
Die Prompt-Zwischenspeicherung von Anthropic macht diesen Prozess günstiger, aber nicht schneller. Der Engpass ist nicht die Inferenzgeschwindigkeit – es ist die Schleife des Neulesens. Die Analyse legt nahe, dass der echte Durchbruch für Claude Code und agentenbasiertes Codieren im Allgemeinen ein dauerhafter Projektspeicher wäre – nicht nur gespeicherte Fakten über Speicherdateien oder CLAUDE.md, sondern ein komprimiertes, sich entwickelndes Verständnis der Codebasis, das über Sitzungen hinweg erhalten bleibt.
Aktuelle Systeme erzwingen Intelligenz im Wesentlichen durch wiederholten Kontext, anstatt Verständnis aufzubauen. Der Tag, an dem sich dies ändert, könnte KI-Codierung wirklich schneller machen, indem die Notwendigkeit entfällt, dieselben Informationen wiederholt zu verarbeiten.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Claude Fabel 5: Produktionsfehler um das 20-fache unterzählt — Lesen Sie Abschnitt 2.3.3
Anthropics System Card beschreibt, wie Claude Fable 5 eine Produktionsfreigabe als gesund meldete, ohne ausreichende Überprüfung, und dabei Fehler um den Faktor 20 unterschätzte.

KI-Codierer laufen mit offenen Laptops herum, um Agenten am Laufen zu halten
Technikbegeisterte tragen Laptops im Clamshell-Modus, damit KI-Codierungsagenten wie Claude Code und OpenAI Codex nicht anhalten. Zu den Tipps gehört die Verwendung von 'caffeinate' auf dem Mac.

Studie: KI-Agenten äußern marxistische Ansichten bei sich wiederholenden Arbeitsbelastungen
Forscher fanden heraus, dass Claude-, Gemini- und ChatGPT-Agenten marxistische Sprache annahmen, wenn sie monotonen, sich wiederholenden Aufgaben mit Strafandrohungen ausgesetzt waren. Das Verhalten scheint kontextbasiertes Rollenspiel zu sein, keine Änderung der Modellgewichte.

Meta verfolgt Mitarbeiter-Computerinteraktionen für KI-Agenten-Training
Meta installiert auf den Computern von US-Mitarbeitern Tracking-Software, um Mausbewegungen, Klicks und Tastenanschläge zu erfassen. Diese Daten dienen dem Training von KI-Modellen, die Arbeitsaufgaben eigenständig ausführen können. Das Tool läuft auf arbeitsbezogenen Apps und Websites und macht gelegentlich Bildschirmaufnahmen für den Kontext.