Claude Code ralentissements : cause fenêtre 1M tokens ?

L'expansion de la fenêtre de contexte provoque une tension du système

Anthropic a récemment publié Opus 4.6 avec une fenêtre de contexte de 1 million de tokens pour tous les utilisateurs. Suite à cette sortie, les utilisateurs ont signalé deux problèmes majeurs : une dégradation des performances sur les tâches longues et des problèmes de capacité accrus. Il n'y avait initialement aucune option pour se désengager du modèle à contexte de 1 million de tokens.

La théorie : une compression de contexte inefficace

L'analyse de l'utilisateur de Reddit suggère que le système de compression de contexte de Claude Code—qui résume l'ancien historique de conversation pour économiser des tokens—n'est pas assez agressif pour la fenêtre de contexte étendue de 1 million de tokens. Cela signifie que chaque session Claude Code envoie probablement plus de données brutes de tokens par requête que nécessaire. Multipliée par l'ensemble des utilisateurs, cela crée une surcharge des serveurs, car les utilisateurs envoient involontairement des contextes gonflés contenant des informations inutiles.

Impact sur les limites d'utilisation

La théorie postule que la solution à court terme d'Anthropic a été de réduire les limites d'utilisation pour compenser la charge accrue des serveurs. Cela explique pourquoi les limites semblent avoir diminué—les utilisateurs consomment des tokens plus rapidement par tâche, et non à cause de réductions intentionnelles des limites par Anthropic.

Une solution de contournement identifiée

Hier, Anthropic a discrètement réintroduit l'ancien modèle, sans fenêtre de contexte de 1 million de tokens, comme option. Les utilisateurs qui sont passés à ce modèle ont signalé une stabilité nettement améliorée et une consommation plus lente de leurs limites d'utilisation, soutenant ainsi la théorie sur les inefficacités de la fenêtre de contexte.

Action recommandée

Pour un soulagement immédiat des limites de débit et des problèmes de stabilité, essayez de désactiver le modèle à contexte de 1 million de tokens. La solution à long terme nécessitera probablement des algorithmes de compression de contexte améliorés. Une fois mis en œuvre, cela pourrait permettre à Anthropic de rétablir les limites d'utilisation précédentes.

📖 Lire la source complète : r/ClaudeAI

Les limites de débit de Claude Code peuvent être dues à une surcharge de la fenêtre de contexte de 1 million de tokens

L'expansion de la fenêtre de contexte provoque une tension du système

La théorie : une compression de contexte inefficace

Impact sur les limites d'utilisation

Une solution de contournement identifiée

Action recommandée

👀 See Also

Explorer les Complexités d'OpenClaw : Comment Cela Fonctionne

Anthropic sécurise 300 MW de capacité de calcul au Colossus 1 avec 220 000 GPU NVIDIA via un partenariat avec SpaceX

Terry Tao sur les vérificateurs de preuve IA : Lean, collaboration et mathématiques formelles

Révision de code GitHub Copilot consommera des minutes Actions à partir du 1er juin 2026