Claudetop : Surveillance des Coûts en Temps Réel pour les Sessions de Code Claude

Claudetop : Surveillance des Coûts en Temps Réel pour les Sessions Claude Code
Claudetop est un outil de surveillance pour Claude Code qui affiche le suivi des coûts en temps réel, les métriques d'efficacité du cache et les comparaisons de modèles pendant les sessions de codage. L'outil a été créé après que le développeur a remarqué une divergence où les estimations du modèle indiquaient 10 $ mais que la facturation réelle était de 65 $, avec la compaction masquant 80 % de l'utilisation des tokens.
Options d'Installation
Trois méthodes d'installation sont disponibles :
- Cloner et installer :
git clone https://github.com/liorwn/claudetop.gitpuiscd claudetop && ./install.sh - En une ligne :
curl -fsSL https://raw.githubusercontent.com/liorwn/claudetop/main/install.sh | bash - En tant que plugin Claude Code :
claude plugin marketplace add liorwn/claudetoppuisclaude plugin install claudetop
L'installation du plugin fournit automatiquement le hook SessionEnd ainsi que les commandes slash : /claudetop:stats, /claudetop:dashboard, /claudetop:branch, /claudetop:export et /claudetop:pricing.
Informations Affichées
Pendant les sessions, Claudetop affiche :
- L'emplacement et la profondeur du projet actuel
- Le modèle actif et la durée de la session
- Le coût actuel, le taux de consommation horaire et le coût mensuel projeté
- Le pourcentage d'efficacité du cache et le coût par ligne
- Les coûts comparatifs pour d'autres modèles (Opus, Sonnet, Haiku)
- La répartition des tokens : pourcentages d'entrée/sortie avec les catégories fresh, cwrite et cread
Fonctionnalités Clés
Suivi des coûts en temps réel : Affiche le coût réel de la session (en vert), le taux de consommation horaire et la prévision mensuelle extrapolée à partir de l'historique. Les tarifs sont mis à jour automatiquement depuis pricing.json lorsque Anthropic modifie les prix.
Comparaison des coûts des modèles : Affiche ce que coûterait la session sur Opus, Sonnet ou Haiku avec des tarifs prenant en compte le cache qui tiennent compte du taux réel de succès du cache. Le modèle actuel est mis en gras pour une comparaison instantanée.
Surveillance de l'efficacité du cache : Le taux de succès du cache indique l'efficacité : vert (≥60 %) signifie que la plupart des tokens d'entrée sont réutilisés, rouge (<30 %) indique que quelque chose force des relectures complètes.
Alertes Intelligentes
Les alertes n'apparaissent que lorsque l'attention est nécessaire :
- JALON 5 $ / 10 $ / 25 $ : Jalon de coût franchi - vérification rapide de la valeur
- DÉPASSEMENT DE BUDGET : Budget quotidien dépassé - terminer ou changer de modèle
- ENVISAGER UNE NOUVELLE SESSION : >2h + >60 % de contexte - rendements décroissants
- FAIBLE CACHE : <20 % de cache après 5 min - le contexte a été réinitialisé, les tokens sont relus
- TAUX DE CONSOMMATION : >15 $/h de vélocité - sous-agents incontrôlés ou boucles serrées
- EN BOUCLE ? : >1 $ dépensé, aucune sortie de code - bloqué dans une boucle de recherche
- ESSAYER /fast : >0,05 $/ligne sur Opus - la tâche n'a pas besoin du plus gros modèle
- COMPACTER BIENTÔT : Fenêtre de contexte >80 % pleine - compaction automatique imminente
Historique et Analyse des Sessions
Chaque session est automatiquement enregistrée. Utilisez claudetop-stats avec divers arguments :
claudetop-stats- Résumé du jourclaudetop-stats week- Cette semaineclaudetop-stats month- Ce mois-ciclaudetop-stats all- Toutes les sessionsclaudetop-stats tag auth- Filtrer par étiquette
Cet outil est destiné aux développeurs utilisant Claude Code qui souhaitent une visibilité sur leurs habitudes de dépenses en IA et veulent optimiser l'utilisation des modèles et l'efficacité du cache.
📖 Read the full source: HN AI Agents
👀 See Also
Collaborer : Une compétence Claude Code pour la rédaction structurée et asynchrone de documents avec transferts multi-agents
Une compétence Claude Code appelée « collaborate » permet l'écriture collaborative de documents où chaque participant reçoit un briefing de Claude en anglais simple sur les changements précédents, le raisonnement et les tâches suivantes, avec prise en charge des sections parallèles, des critiques structurées et des notifications Slack/Signal.

SkyClaw : Runtime d'Agent IA Rust pour VPS Cloud avec Contrôle Telegram
SkyClaw est un runtime d'agent IA basé sur Rust de 6,9 Mo conçu pour le déploiement sur VPS cloud avec Telegram comme unique interface. Il exécute des commandes shell, navigue sur le web via Chrome headless, lit/écrit des fichiers et récupère des URL avec un enchaînement d'outils en plusieurs tours.

Queuelo : Une API d'approbation légère pour les agents LLM
Queuelo est une couche API simple qui permet aux agents LLM de faire une pause avant des actions irréversibles. Les agents envoient des requêtes d'action via POST, vous êtes notifié pour approuver ou rejeter, et l'agent reçoit la réponse via webhook.

Développement Guidé par Manuel : Une Méthode pour Prévenir la Dérivation Confiante du Code Claude
Le développement piloté manuellement (MDD) est une méthode qui traite de la divergence confiante dans Claude Code, où l'IA produit un code erroné qui passe ses propres tests. Lors d'un audit de production, le MDD a identifié 190 problèmes, écrit 876 nouveaux tests en moins de 8 heures et éliminé toutes les violations de règles.