Claudetop: Echtzeit-Kostenüberwachung für Claude Code

Claudetop: Echtzeit-Kostenüberwachung für Claude Code-Sitzungen

Claudetop ist ein Überwachungstool für Claude Code, das Echtzeit-Kostenverfolgung, Cache-Effizienzmetriken und Modellvergleiche während der Codingsitzungen anzeigt. Das Tool wurde erstellt, nachdem der Entwickler eine Diskrepanz feststellte, bei der Modellschätzungen 10 $ anzeigten, die tatsächliche Abrechnung jedoch 65 $ betrug, wobei die Komprimierung 80 % der Token-Nutzung verbarg.

Installationsoptionen

Drei Installationsmethoden sind verfügbar:

Klonen und installieren: git clone https://github.com/liorwn/claudetop.git dann cd claudetop && ./install.sh
Einzeiler: curl -fsSL https://raw.githubusercontent.com/liorwn/claudetop/main/install.sh | bash
Als Claude Code-Plugin: claude plugin marketplace add liorwn/claudetop dann claude plugin install claudetop

Die Plugin-Installation bietet automatisch SessionEnd-Hook plus Slash-Befehle: /claudetop:stats, /claudetop:dashboard, /claudetop:branch, /claudetop:export und /claudetop:pricing.

Angezeigte Informationen

Während der Sitzungen zeigt Claudetop:

Aktuellen Projektstandort und -tiefe
Aktives Modell und Sitzungsdauer
Aktuelle Kosten, stündliche Burn-Rate und prognostizierte monatliche Kosten
Cache-Effizienz in Prozent und Kosten pro Zeile
Vergleichskosten für andere Modelle (Opus, Sonnet, Haiku)
Token-Aufschlüsselung: Eingabe/Ausgabe-Prozentsätze mit Kategorien fresh, cwrite und cread

Hauptfunktionen

Echtzeit-Kostenverfolgung: Zeigt tatsächliche Sitzungskosten (grün), Burn-Rate pro Stunde und monatliche Prognose, die aus dem Verlauf extrapoliert wird. Preisaktualisierungen erfolgen automatisch aus pricing.json, wenn Anthropic die Preise ändert.

Modellkostenvergleich: Zeigt, was die Sitzung auf Opus, Sonnet oder Haiku kosten würde, mit cache-bewusster Preisgestaltung, die die tatsächliche Cache-Trefferquote berücksichtigt. Das aktuelle Modell ist für sofortigen Vergleich fett hervorgehoben.

Cache-Effizienzüberwachung: Cache-Trefferquote zeigt Effizienz an: grün (≥60 %) bedeutet, dass die meisten Eingabe-Token wiederverwendet werden, rot (<30 %) zeigt an, dass etwas vollständige Neu-Lesevorgänge erzwingt.

Intelligente Warnungen

Warnungen erscheinen nur, wenn Aufmerksamkeit erforderlich ist:

5 $ MARK / 10 $ / 25 $: Kostenmeilenstein überschritten - Bauchgefühl-Prüfung
ÜBER BUDGET: Tagesbudget überschritten - abschließen oder Modelle wechseln
FRISCHE SITZUNG ERWÄGEN: >2 Std. + >60 % Kontext - abnehmende Erträge
GERINGER CACHE: <20 % Cache nach 5 Min. - Kontext wurde zurückgesetzt, Token werden neu gelesen
BURN RATE: >15 $/Std. Geschwindigkeit - außer Kontrolle geratene Subagenten oder enge Schleifen
SPINNING?: >1 $ ausgegeben, null Code-Ausgabe - in Forschungsschleife stecken geblieben
TRY /fast: >0,05 $/Zeile auf Opus - Aufgabe benötigt nicht das größte Modell
BALD KOMPRIMIEREN: Kontextfenster >80 % voll - automatische Komprimierung steht bevor

Sitzungsverlauf & Analytik

Jede Sitzung wird automatisch protokolliert. Verwende claudetop-stats mit verschiedenen Argumenten:

claudetop-stats - Zusammenfassung von heute
claudetop-stats week - Diese Woche
claudetop-stats month - Dieser Monat
claudetop-stats all - Gesamter Zeitraum
claudetop-stats tag auth - Nach Tag filtern

Dieses Tool ist für Entwickler, die Claude Code nutzen und Einblick in ihre KI-Ausgabenmuster haben möchten, um Modellnutzung und Cache-Effizienz zu optimieren.

📖 Read the full source: HN AI Agents