KI-Token-Monitor: macOS-Tool verfolgt lokale Claude-Nutzung und Kosten

AI Token Monitor: Lokale Claude-Nutzungsverfolgung
Ein Entwickler hat AI Token Monitor erstellt, eine macOS-Menüleisten-Anwendung, die die Claude AI-Nutzung überwacht, indem sie lokale Sitzungsdateien liest. Das Tool bietet Echtzeit-Verfolgung ohne API-Schlüssel oder Kontozugang.
So funktioniert es
Die App liest lokale Claude-Sitzungsdateien unter ~/.claude/projects/**/*.jsonl. Alle Daten bleiben auf dem Gerät des Nutzers, ohne dass Informationen an externe Server gesendet werden – außer für eine optionale Bestenliste (Opt-in), die nur aggregierte Tagesstatistiken teilt, keine Codes oder Gespräche.
Verfolgungsergebnisse eines Nutzers
Nach 35 Tagen Verfolgung:
- 6,5 Millionen Token verbraucht – entspricht 4.924 $ zu API-Preisen
- Durchschnittlich 304.000 Token pro Tag über 1.000+ Nachrichten
- Modellverteilung: 78 % Opus 4.6, 21 % Haiku 4.5, 1 % Sonnet 4.6
- Spitzentag: 4. März mit 698.000 Token
Verfügbare Funktionen
- Echtzeit-Kostenanzeige in der Menüleiste
- Tägliche, wöchentliche und monatliche Nutzungstrends
- Modellnutzungsaufschlüsselung
- GitHub-ähnliche Aktivitäts-Heatmap
- Cache-Trefferquote-Verfolgung (für Prompt-Effizienzanalyse)
- Optionale Bestenliste zum Vergleich der Nutzung mit anderen
Erkenntnisse aus der Verfolgung
Der Entwickler entdeckte:
- Höhere Haiku-Nutzung als erwartet, mit signifikanten Cache-Lesevorgängen
- Die produktivsten Tage korrelierten nicht mit der höchsten Token-Nutzung
- Nutzungsmuster an Wochentagen vs. Wochenende unterschieden sich erheblich
Verfügbarkeit und Feedback
Das Tool ist Open Source unter MIT-Lizenz und derzeit nur für macOS Apple Silicon über .dmg-Download verfügbar. Der Entwickler sucht Feedback zu zusätzlichen nützlichen Statistiken, Interesse an einer Windows-Version und Erfahrungen mit der Bestenlisten-Funktion.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

OpenTrace: Selbst gehosteter Observability-Server mit über 75 MCP-Tools
OpenTrace ist ein selbst gehosteter Observability-Server, der über 75+ MCP-Tools Logs, Nutzeranalysen und Datenbank-Introspection bietet und auf einem 4-Dollar-VPS mit SQLite-Speicher und schreibgeschützten Postgres-Verbindungen läuft.

Cortex: Eine lokale Speicherschicht für OpenClaw-Agenten mit Ebbinghaus-Abklang
Cortex ist ein Open-Source-Gedächtniswerkzeug, das entwickelt wurde, um Kontextkomprimierungsprobleme in OpenClaw-Agenten zu lösen. Es implementiert Ebbinghaus-Vergessenskurven für den Faktenverfall, importiert zuerst aus Dateien und läuft als einzelne 19 MB große Go-Binärdatei mit SQLite.

Universal CLAUDE.md reduziert Claude-Ausgabetokens in Benchmarks um 63 %.
Ein Entwickler hat eine universelle CLAUDE.md-Datei erstellt, die die Ausgabetokens von Claude in fünf Benchmark-Tests um 63 % reduziert, während die technische Genauigkeit erhalten bleibt. Die Datei behandelt häufige Claude-Verhaltensweisen wie ausführliche Antworten, unnötige Formatierungen und unerwünschte Vorschläge.

OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats
OmniRecall ist eine lokale mitmproxy-Umgehung, die den Datenverkehr zu Cloud-Chat-Schnittstellen wie DeepSeek abfängt und eine permanente Speicherschicht mittels FAISS-Indexierung und sentence-transformers MiniLM-L6 hinzufügt. Es befindet sich derzeit in der Beta-Phase, erfordert CPU-only-Betrieb und verwendet eine aggressiv restriktive quelloffene Lizenz.