Problèmes de compaction Claude AI : Fix et solutions

Fonctionnement de la Compaction

Les sessions Claude sont stockées sous forme de fichiers JSONL à l'emplacement ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl. Chaque tour de conversation est un bloc JSON. Lorsque la compaction se déclenche, les blocs originaux restent dans le fichier, mais un nouveau bloc contenant un résumé compressé est ajouté. Après la compaction, le modèle travaille à partir du résumé plutôt que de l'historique complet de la conversation.

Résultats des Tests

Avec un projet de codage à 90 % de remplissage du contexte (avant l'augmentation à 1 million de tokens), l'utilisateur a testé 10 questions couvrant le rappel simple, les chaînes de dépendance à 6 sauts, la désambiguïsation d'entités, l'enchaînement de négations, la détection d'absence et la détection de conflits.

Avant compaction : ~9,75/10 de précision avec Opus 4.6 trouvant des faits dispersés sur 418 000 tokens
Après compaction (par défaut) : ~5/10 de précision avec 3 461 tokens (compression 121x). La même session, les mêmes questions ont donné des réponses incorrectes hallucinées.
Après compaction (Manuelle Opus) : ~9,75/10 de précision avec 6 080 tokens (compression 69x). L'utilisation d'une invite de compaction personnalisée avec Opus a préservé les informations importantes.

Pourquoi cette Différence

Selon la documentation d'Anthropic, l'API utilise par défaut le même modèle pour la compaction. L'utilisateur utilisait Opus 4.6 sur un calcul moyen, donc la compaction par défaut aurait dû utiliser Opus également. La différence de qualité suggère des problèmes avec l'invite de synthèse, le budget de réflexion/calcul, ou les deux.

Solutions de Contournement

Approche 1 : Compaction Opus - Désactivez la compaction automatique et mettez en place un processus en arrière-plan qui mesure les comptes de tokens pour les instances Claude Code. Déclenchez la compaction en utilisant Opus avec une invite personnalisée (éventuellement avec l'autorisation de l'utilisateur).

Approche 2 : Pré-ensemencement spaCy NER - Au lieu de démarrer les sous-agents avec un contexte nul, utilisez spaCy NER pour extraire les noms propres, les nombres, les noms de services, les ports et les identifiants clés des fichiers du projet. Injectez cela comme un briefing d'entités léger (quelques centaines de tokens) au démarrage pour informer les agents des ressources existantes sans encombrement narratif.

📖 Read the full source: r/ClaudeAI