Analyse Consommation Jetons Claude 1M : Croissance & Cache

Analyse de la Consommation de Tokens à partir de Données Réelles d'Utilisation

Une analyse détaillée de l'implémentation de la fenêtre de contexte de 1M de Claude révèle des facteurs techniques spécifiques causant une consommation rapide de tokens. L'auteur a analysé des fichiers de session JSONL à travers plusieurs conversations pour identifier des schémas.

Principales Constatations Tirées des Données

Croissance de Contexte Non Limitée : Avant la fenêtre de contexte de 1M, le compactage automatique se déclenchait à environ 160K tokens. Après l'implémentation du 1M, cette limite a disparu, permettant aux sessions d'atteindre régulièrement 500K+ tokens. Chaque invite renvoie l'intégralité du contexte, ce qui signifie qu'à 500K tokens, même une simple confirmation coûte 500K tokens. Si Claude effectue 3 appels d'outils pour répondre à une invite, cela représente 1,5M tokens pour une seule interaction.

Effet Cumulatif des Défauts de Cache : Anthropic met en cache le contexte côté serveur pendant environ 5 minutes. Après cette période, l'invite suivante retraite l'intégralité du contexte à un coût environ 10 fois supérieur à celui du cache. Bien que le taux de défauts de cache n'ait pas changé (restant à environ 2,5 % des tours), un défaut de cache à 500K de contexte est nettement plus coûteux qu'à 150K de contexte.

Outil d'Analyse

L'auteur a créé un script Python qui analyse les comptes de tokens à partir des fichiers de session JSONL de Claude sans accéder au contenu des conversations. Le script détecte automatiquement votre répertoire de données Claude et nécessite matplotlib et numpy. Le script est disponible à l'adresse : https://github.com/RyanSeanPhillips/cldctrl/blob/master/docs/context_analysis.py

L'auteur mentionne également CLD CTRL (https://github.com/RyanSeanPhillips/cldctrl), un tableau de bord en terminal pour lancer et surveiller les sessions Claude Code, l'utilisation de tokens et l'activité des projets.

📖 Read the full source: r/ClaudeAI

Analyyser la consommation de jetons de la fenêtre de contexte de 1 million de Claude : les données révèlent une croissance illimitée et un effet cumulatif des défauts de cache

Analyse de la Consommation de Tokens à partir de Données Réelles d'Utilisation

Principales Constatations Tirées des Données

Outil d'Analyse

👀 See Also

Anthropic inverse sa politique sur le SDK d'agent tiers et claude-p, réduit la valeur d'inférence effective de 25 à 40 fois pour les abonnés Max

Les abonnements IA ont besoin d'un compteur fiable : un appel à la transparence des services

OpenAI va déployer des modèles d'IA sur le réseau classifié du Département de la Guerre des États-Unis.

OneUptime ajoute 12 000 articles de blog générés par IA en un seul commit.