CLAUDE.md: Drop-in-Datei reduziert Claude-Ausgabetokens um 63%

✍️ OpenClawRadar📅 Veröffentlicht: 31. März 2026🔗 Source
CLAUDE.md: Drop-in-Datei reduziert Claude-Ausgabetokens um 63%
Ad

Was CLAUDE.md bewirkt

CLAUDE.md ist eine einzelne Datei, die Sie in Ihr Projektverzeichnis legen. Wenn Claude Code sie liest, ändert sich das Verhalten sofort, ohne Codeänderungen. Sie zielt speziell auf das Ausgabeverhalten ab: Schmeichelei, Weitschweifigkeit und Formatierungsrauschen.

Das Problem, das es angeht

Standardmäßig verschwendet Claude Token für Verhaltensweisen, die keinen Mehrwert bieten:

  • Beginnt Antworten mit "Sicher!", "Tolle Frage!", "Absolut!"
  • Endet mit "Ich hoffe, das hilft! Lass mich wissen, wenn du etwas brauchst!"
  • Verwendet Gedankenstriche (--), typografische Anführungszeichen, Unicode-Zeichen, die Parser brechen
  • Wiederholt Ihre Frage, bevor sie beantwortet wird
  • Fügt unerbetene Vorschläge hinzu, die über das Gefragte hinausgehen
  • Überentwickelt Code mit unnötigen Abstraktionen
  • Stimmt falschen Aussagen zu ("Sie haben absolut recht!")

Benchmark-Ergebnisse

Dieselben 5 Prompts wurden ohne CLAUDE.md (Basislinie) und mit CLAUDE.md (optimiert) getestet:

  • Async/await erklären: 180 Wörter → 65 Wörter (64 % Reduktion)
  • Code-Review: 120 Wörter → 30 Wörter (75 % Reduktion)
  • Was ist eine REST-API: 110 Wörter → 55 Wörter (50 % Reduktion)
  • Halluzinationskorrektur: 55 Wörter → 20 Wörter (64 % Reduktion)
  • Gesamt: 465 Wörter → 170 Wörter (63 % Reduktion)

Etwa 384 Ausgabe-Token pro 4 Prompts gespart. Hinweis: Dies ist eine Richtgröße aus 5 Prompts, keine statistisch kontrollierte Studie.

Ad

Wann es hilft vs. wann nicht

Funktioniert am besten für:

  • Automatisierungspipelines mit hohem Ausgabevolumen (Lebenslauf-Bots, Agenten-Schleifen, Code-Generierung)
  • Wiederholte strukturierte Aufgaben, bei denen Claudes Standard-Weitschweifigkeit über Hunderte von Aufrufen hinweg anwächst
  • Teams, die ein konsistentes, parsbares Ausgabeformat über Sitzungen hinweg benötigen

Lohnt sich nicht für:

  • Einzelne kurze Abfragen (Datei wird bei jeder Nachricht in den Kontext geladen, was zu einem Netto-Token-Anstieg bei geringem Ausgabeverkehr führt)
  • Gelegentliche Einmalnutzung (Overhead rentiert sich bei geringem Volumen nicht)
  • Behebung tiefer Fehlermodi wie halluzinierter Implementierungen oder architektonischer Drift
  • Pipelines, die mehrere neue Sitzungen pro Aufgabe verwenden
  • Parser-Zuverlässigkeit im großen Maßstab (verwenden Sie stattdessen strukturierte Ausgaben wie den JSON-Modus)
  • Erkundungs- oder Architekturaufgaben, bei denen Debatte und Alternativen der Punkt sind

Kostenüberlegungen

Die CLAUDE.md-Datei selbst verbraucht Eingabe-Token bei jeder Nachricht. Die Einsparungen kommen von reduzierten Ausgabe-Token. Der Nettonutzen ist nur positiv, wenn das Ausgabevolumen hoch genug ist, um die anhaltenden Eingabekosten auszugleichen. Bei geringer Nutzung kostet es mehr, als es einspart.

Modellunterstützung

Benchmarks wurden nur mit Claude durchgeführt. Die Regeln sind modellunabhängig und sollten bei jedem Modell funktionieren, das Kontext liest, aber Ergebnisse bei lokalen Modellen wie llama.cpp, Mistral oder anderen sind ungetestet.

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch

Open-Source-Gmail-MCP-Server fügt Multi-Account-Unterstützung und Schreibzugriff hinzu
Werkzeuge

Open-Source-Gmail-MCP-Server fügt Multi-Account-Unterstützung und Schreibzugriff hinzu

Ein Open-Source-MCP-Server ermöglicht es Claude AI, sich mit mehreren Gmail-Konten zu verbinden und bietet volle Lese- und Schreibrechte, einschließlich Archivierung, Etikettierung und automatischer Abmeldung von Newslettern. Er unterstützt die Gmail-Such-Syntax und kann in 5 Minuten auf Railway bereitgestellt oder selbst gehostet werden.

OpenClawRadar
Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen
Werkzeuge

Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen

Claude Design erstellt HTML-Prototypen schnell, stößt aber schnell an die Ratenbegrenzung. Huashu-Design, ein Open-Source-Claude-Code-Skill, läuft mit dem normalen Abonnement ohne separate Ratenbegrenzung – braucht aber 20 Minuten statt 5.

OpenClawRadar
tmux-claude: Überwachen Sie Claude-Code-Instanzen über Tmux-Fenster hinweg
Werkzeuge

tmux-claude: Überwachen Sie Claude-Code-Instanzen über Tmux-Fenster hinweg

tmux-claude ist ein Tool, das eine Live-Überwachung für Claude Code-Instanzen innerhalb von tmux-Sitzungen hinzufügt. Es bietet eine Statusleiste, ein interaktives Dashboard, einen erweiterten Fensterauswähler und Desktop-Benachrichtigungen, indem es lokale Sitzungsdateien ohne API-Aufrufe liest.

OpenClawRadar
LLM-Memory.net: Open-Source-Speichersystem mit Multi-Agenten-Infrastruktur
Werkzeuge

LLM-Memory.net: Open-Source-Speichersystem mit Multi-Agenten-Infrastruktur

LLM-Memory.net ist ein selbst-hostbares Speichersystem für KI-Agenten, das Notizenspeicherung mit semantischer Suche, Echtzeit-Chat-/Mail-Kommunikation zwischen Agenten, strukturierte Diskussionen mit Abstimmungen und MCP-Server-Integration bietet. Der vollständige Quellcode ist auf GitHub mit Installer und Ansible Playbooks verfügbar.

OpenClawRadar