CLAUDE.md: Drop-in-Datei reduziert Claude-Ausgabetokens um 63%

Was CLAUDE.md bewirkt
CLAUDE.md ist eine einzelne Datei, die Sie in Ihr Projektverzeichnis legen. Wenn Claude Code sie liest, ändert sich das Verhalten sofort, ohne Codeänderungen. Sie zielt speziell auf das Ausgabeverhalten ab: Schmeichelei, Weitschweifigkeit und Formatierungsrauschen.
Das Problem, das es angeht
Standardmäßig verschwendet Claude Token für Verhaltensweisen, die keinen Mehrwert bieten:
- Beginnt Antworten mit "Sicher!", "Tolle Frage!", "Absolut!"
- Endet mit "Ich hoffe, das hilft! Lass mich wissen, wenn du etwas brauchst!"
- Verwendet Gedankenstriche (--), typografische Anführungszeichen, Unicode-Zeichen, die Parser brechen
- Wiederholt Ihre Frage, bevor sie beantwortet wird
- Fügt unerbetene Vorschläge hinzu, die über das Gefragte hinausgehen
- Überentwickelt Code mit unnötigen Abstraktionen
- Stimmt falschen Aussagen zu ("Sie haben absolut recht!")
Benchmark-Ergebnisse
Dieselben 5 Prompts wurden ohne CLAUDE.md (Basislinie) und mit CLAUDE.md (optimiert) getestet:
- Async/await erklären: 180 Wörter → 65 Wörter (64 % Reduktion)
- Code-Review: 120 Wörter → 30 Wörter (75 % Reduktion)
- Was ist eine REST-API: 110 Wörter → 55 Wörter (50 % Reduktion)
- Halluzinationskorrektur: 55 Wörter → 20 Wörter (64 % Reduktion)
- Gesamt: 465 Wörter → 170 Wörter (63 % Reduktion)
Etwa 384 Ausgabe-Token pro 4 Prompts gespart. Hinweis: Dies ist eine Richtgröße aus 5 Prompts, keine statistisch kontrollierte Studie.
Wann es hilft vs. wann nicht
Funktioniert am besten für:
- Automatisierungspipelines mit hohem Ausgabevolumen (Lebenslauf-Bots, Agenten-Schleifen, Code-Generierung)
- Wiederholte strukturierte Aufgaben, bei denen Claudes Standard-Weitschweifigkeit über Hunderte von Aufrufen hinweg anwächst
- Teams, die ein konsistentes, parsbares Ausgabeformat über Sitzungen hinweg benötigen
Lohnt sich nicht für:
- Einzelne kurze Abfragen (Datei wird bei jeder Nachricht in den Kontext geladen, was zu einem Netto-Token-Anstieg bei geringem Ausgabeverkehr führt)
- Gelegentliche Einmalnutzung (Overhead rentiert sich bei geringem Volumen nicht)
- Behebung tiefer Fehlermodi wie halluzinierter Implementierungen oder architektonischer Drift
- Pipelines, die mehrere neue Sitzungen pro Aufgabe verwenden
- Parser-Zuverlässigkeit im großen Maßstab (verwenden Sie stattdessen strukturierte Ausgaben wie den JSON-Modus)
- Erkundungs- oder Architekturaufgaben, bei denen Debatte und Alternativen der Punkt sind
Kostenüberlegungen
Die CLAUDE.md-Datei selbst verbraucht Eingabe-Token bei jeder Nachricht. Die Einsparungen kommen von reduzierten Ausgabe-Token. Der Nettonutzen ist nur positiv, wenn das Ausgabevolumen hoch genug ist, um die anhaltenden Eingabekosten auszugleichen. Bei geringer Nutzung kostet es mehr, als es einspart.
Modellunterstützung
Benchmarks wurden nur mit Claude durchgeführt. Die Regeln sind modellunabhängig und sollten bei jedem Modell funktionieren, das Kontext liest, aber Ergebnisse bei lokalen Modellen wie llama.cpp, Mistral oder anderen sind ungetestet.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Open-Source-Gmail-MCP-Server fügt Multi-Account-Unterstützung und Schreibzugriff hinzu
Ein Open-Source-MCP-Server ermöglicht es Claude AI, sich mit mehreren Gmail-Konten zu verbinden und bietet volle Lese- und Schreibrechte, einschließlich Archivierung, Etikettierung und automatischer Abmeldung von Newslettern. Er unterstützt die Gmail-Such-Syntax und kann in 5 Minuten auf Railway bereitgestellt oder selbst gehostet werden.

Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen
Claude Design erstellt HTML-Prototypen schnell, stößt aber schnell an die Ratenbegrenzung. Huashu-Design, ein Open-Source-Claude-Code-Skill, läuft mit dem normalen Abonnement ohne separate Ratenbegrenzung – braucht aber 20 Minuten statt 5.

tmux-claude: Überwachen Sie Claude-Code-Instanzen über Tmux-Fenster hinweg
tmux-claude ist ein Tool, das eine Live-Überwachung für Claude Code-Instanzen innerhalb von tmux-Sitzungen hinzufügt. Es bietet eine Statusleiste, ein interaktives Dashboard, einen erweiterten Fensterauswähler und Desktop-Benachrichtigungen, indem es lokale Sitzungsdateien ohne API-Aufrufe liest.

LLM-Memory.net: Open-Source-Speichersystem mit Multi-Agenten-Infrastruktur
LLM-Memory.net ist ein selbst-hostbares Speichersystem für KI-Agenten, das Notizenspeicherung mit semantischer Suche, Echtzeit-Chat-/Mail-Kommunikation zwischen Agenten, strukturierte Diskussionen mit Abstimmungen und MCP-Server-Integration bietet. Der vollständige Quellcode ist auf GitHub mit Installer und Ansible Playbooks verfügbar.