CLAUDE.md: 63% weniger Output-Tokens

Was CLAUDE.md bewirkt

CLAUDE.md ist eine einzelne Datei, die Sie in Ihr Projektverzeichnis legen. Wenn Claude Code sie liest, ändert sich das Verhalten sofort, ohne Codeänderungen. Sie zielt speziell auf das Ausgabeverhalten ab: Schmeichelei, Weitschweifigkeit und Formatierungsrauschen.

Das Problem, das es angeht

Standardmäßig verschwendet Claude Token für Verhaltensweisen, die keinen Mehrwert bieten:

Beginnt Antworten mit "Sicher!", "Tolle Frage!", "Absolut!"
Endet mit "Ich hoffe, das hilft! Lass mich wissen, wenn du etwas brauchst!"
Verwendet Gedankenstriche (--), typografische Anführungszeichen, Unicode-Zeichen, die Parser brechen
Wiederholt Ihre Frage, bevor sie beantwortet wird
Fügt unerbetene Vorschläge hinzu, die über das Gefragte hinausgehen
Überentwickelt Code mit unnötigen Abstraktionen
Stimmt falschen Aussagen zu ("Sie haben absolut recht!")

Benchmark-Ergebnisse

Dieselben 5 Prompts wurden ohne CLAUDE.md (Basislinie) und mit CLAUDE.md (optimiert) getestet:

Async/await erklären: 180 Wörter → 65 Wörter (64 % Reduktion)
Code-Review: 120 Wörter → 30 Wörter (75 % Reduktion)
Was ist eine REST-API: 110 Wörter → 55 Wörter (50 % Reduktion)
Halluzinationskorrektur: 55 Wörter → 20 Wörter (64 % Reduktion)
Gesamt: 465 Wörter → 170 Wörter (63 % Reduktion)

Etwa 384 Ausgabe-Token pro 4 Prompts gespart. Hinweis: Dies ist eine Richtgröße aus 5 Prompts, keine statistisch kontrollierte Studie.

Wann es hilft vs. wann nicht

Funktioniert am besten für:

Automatisierungspipelines mit hohem Ausgabevolumen (Lebenslauf-Bots, Agenten-Schleifen, Code-Generierung)
Wiederholte strukturierte Aufgaben, bei denen Claudes Standard-Weitschweifigkeit über Hunderte von Aufrufen hinweg anwächst
Teams, die ein konsistentes, parsbares Ausgabeformat über Sitzungen hinweg benötigen

Lohnt sich nicht für:

Einzelne kurze Abfragen (Datei wird bei jeder Nachricht in den Kontext geladen, was zu einem Netto-Token-Anstieg bei geringem Ausgabeverkehr führt)
Gelegentliche Einmalnutzung (Overhead rentiert sich bei geringem Volumen nicht)
Behebung tiefer Fehlermodi wie halluzinierter Implementierungen oder architektonischer Drift
Pipelines, die mehrere neue Sitzungen pro Aufgabe verwenden
Parser-Zuverlässigkeit im großen Maßstab (verwenden Sie stattdessen strukturierte Ausgaben wie den JSON-Modus)
Erkundungs- oder Architekturaufgaben, bei denen Debatte und Alternativen der Punkt sind

Kostenüberlegungen

Die CLAUDE.md-Datei selbst verbraucht Eingabe-Token bei jeder Nachricht. Die Einsparungen kommen von reduzierten Ausgabe-Token. Der Nettonutzen ist nur positiv, wenn das Ausgabevolumen hoch genug ist, um die anhaltenden Eingabekosten auszugleichen. Bei geringer Nutzung kostet es mehr, als es einspart.

Modellunterstützung

Benchmarks wurden nur mit Claude durchgeführt. Die Regeln sind modellunabhängig und sollten bei jedem Modell funktionieren, das Kontext liest, aber Ergebnisse bei lokalen Modellen wie llama.cpp, Mistral oder anderen sind ungetestet.

📖 Read the full source: HN AI Agents