Claudetop: Echtzeit-Kostenüberwachung für Claude-Code-Sitzungen

Claudetop: Echtzeit-Kostenüberwachung für Claude Code-Sitzungen
Claudetop ist ein Überwachungstool für Claude Code, das Echtzeit-Kostenverfolgung, Cache-Effizienzmetriken und Modellvergleiche während der Codingsitzungen anzeigt. Das Tool wurde erstellt, nachdem der Entwickler eine Diskrepanz feststellte, bei der Modellschätzungen 10 $ anzeigten, die tatsächliche Abrechnung jedoch 65 $ betrug, wobei die Komprimierung 80 % der Token-Nutzung verbarg.
Installationsoptionen
Drei Installationsmethoden sind verfügbar:
- Klonen und installieren:
git clone https://github.com/liorwn/claudetop.gitdanncd claudetop && ./install.sh - Einzeiler:
curl -fsSL https://raw.githubusercontent.com/liorwn/claudetop/main/install.sh | bash - Als Claude Code-Plugin:
claude plugin marketplace add liorwn/claudetopdannclaude plugin install claudetop
Die Plugin-Installation bietet automatisch SessionEnd-Hook plus Slash-Befehle: /claudetop:stats, /claudetop:dashboard, /claudetop:branch, /claudetop:export und /claudetop:pricing.
Angezeigte Informationen
Während der Sitzungen zeigt Claudetop:
- Aktuellen Projektstandort und -tiefe
- Aktives Modell und Sitzungsdauer
- Aktuelle Kosten, stündliche Burn-Rate und prognostizierte monatliche Kosten
- Cache-Effizienz in Prozent und Kosten pro Zeile
- Vergleichskosten für andere Modelle (Opus, Sonnet, Haiku)
- Token-Aufschlüsselung: Eingabe/Ausgabe-Prozentsätze mit Kategorien fresh, cwrite und cread
Hauptfunktionen
Echtzeit-Kostenverfolgung: Zeigt tatsächliche Sitzungskosten (grün), Burn-Rate pro Stunde und monatliche Prognose, die aus dem Verlauf extrapoliert wird. Preisaktualisierungen erfolgen automatisch aus pricing.json, wenn Anthropic die Preise ändert.
Modellkostenvergleich: Zeigt, was die Sitzung auf Opus, Sonnet oder Haiku kosten würde, mit cache-bewusster Preisgestaltung, die die tatsächliche Cache-Trefferquote berücksichtigt. Das aktuelle Modell ist für sofortigen Vergleich fett hervorgehoben.
Cache-Effizienzüberwachung: Cache-Trefferquote zeigt Effizienz an: grün (≥60 %) bedeutet, dass die meisten Eingabe-Token wiederverwendet werden, rot (<30 %) zeigt an, dass etwas vollständige Neu-Lesevorgänge erzwingt.
Intelligente Warnungen
Warnungen erscheinen nur, wenn Aufmerksamkeit erforderlich ist:
- 5 $ MARK / 10 $ / 25 $: Kostenmeilenstein überschritten - Bauchgefühl-Prüfung
- ÜBER BUDGET: Tagesbudget überschritten - abschließen oder Modelle wechseln
- FRISCHE SITZUNG ERWÄGEN: >2 Std. + >60 % Kontext - abnehmende Erträge
- GERINGER CACHE: <20 % Cache nach 5 Min. - Kontext wurde zurückgesetzt, Token werden neu gelesen
- BURN RATE: >15 $/Std. Geschwindigkeit - außer Kontrolle geratene Subagenten oder enge Schleifen
- SPINNING?: >1 $ ausgegeben, null Code-Ausgabe - in Forschungsschleife stecken geblieben
- TRY /fast: >0,05 $/Zeile auf Opus - Aufgabe benötigt nicht das größte Modell
- BALD KOMPRIMIEREN: Kontextfenster >80 % voll - automatische Komprimierung steht bevor
Sitzungsverlauf & Analytik
Jede Sitzung wird automatisch protokolliert. Verwende claudetop-stats mit verschiedenen Argumenten:
claudetop-stats- Zusammenfassung von heuteclaudetop-stats week- Diese Wocheclaudetop-stats month- Dieser Monatclaudetop-stats all- Gesamter Zeitraumclaudetop-stats tag auth- Nach Tag filtern
Dieses Tool ist für Entwickler, die Claude Code nutzen und Einblick in ihre KI-Ausgabenmuster haben möchten, um Modellnutzung und Cache-Effizienz zu optimieren.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Mind Protocol: Open-Source-System verleiht Claude persistenten Speicher und Echtzeit-Biometrie-Integration
Mind Protocol ist ein Open-Source-System, in dem Claude kontinuierlich als autonomer Begleiter läuft, mit dauerhaftem Speicher über alle Sitzungen hinweg und Echtzeit-Daten von Garmin-Uhren, die in jedes Gespräch eingespielt werden. Die Architektur nutzt Claude Code als Kern-Engine mit einem Orchestrator, der parallele Sitzungen startet und den Lebenszyklus verwaltet.

Claude Octopus v8.48: Multi-KI-Orchestrierungs-Plugin für Entwicklungs-Workflows
Claude Octopus v8.48 ist ein Open-Source-Plugin, das die KI-Modelle Claude, Codex und Gemini parallel mit unterschiedlichen Rollen über die Entwicklungsphasen hinweg orchestriert. Es beinhaltet eine 75%-Konsensschwelle zwischen den Phasen, frische Kontextfenster für komplexe Aufgaben und spezifische Befehle wie /octo:embrace für die vollständige Lebenszyklusentwicklung.

Homebutler: OpenClaw-Skill für die Homelab-Verwaltung über Telegram
Homebutler ist eine einzelne Go-Binärdatei (~13 MB, ohne Abhängigkeiten), die als OpenClaw-Fähigkeit fungiert, um Homelabs über Telegram-Chats zu verwalten. Es überwacht Server, startet Docker-Container neu, weckt Maschinen auf, scannt Netzwerke und warnt bei Ressourcenauslastungsspitzen, ohne SSH-Sitzungen oder Dashboard-Logins.

Gemma4 26B-A4B bietet schnelle lokale Leistung mit Web-Suche und Bildunterstützung
Das Gemma-4-26B-A4B-Modell erreicht etwa 145 Tokens pro Sekunde auf einer RTX 4090 und umfasst Web-Suche-MCP sowie Bildunterstützung für Chat-Anwendungen. Ein Blogbeitrag erläutert die Einrichtung und plattformübergreifende Nutzung auf Mac und iPhone.