Universal CLAUDE.md réduit les tokens de sortie de Claude de 63 % dans les benchmarks.

Un développeur a publié un fichier universel CLAUDE.md qui réduit considérablement l'utilisation des tokens dans les réponses de Claude tout en maintenant la précision technique. L'outil a été entièrement construit avec l'assistance de Claude lors d'une seule session où Claude a recherché des fils de discussion Reddit, des problèmes GitHub et des études d'ingénierie de prompts.
Ce qu'il corrige
- « Vous avez absolument raison ! » et « Excellente question ! » sur chaque réponse
- Les formules de politesse « J'espère que cela vous aide ! N'hésitez pas si vous avez besoin de quelque chose ! »
- Les tirets cadratins, guillemets intelligents, caractères Unicode qui cassent silencieusement les analyseurs
- La reformulation de votre question avant d'y répondre
- Les suggestions non sollicitées et le code sur-optimisé
- Le cadrage « En tant qu'IA... »
- Garde-fou contre les hallucinations - si vous corrigez Claude sur quelque chose, il le traite comme une vérité absolue pour le reste de la session et ne réaffirme jamais la mauvaise réponse
Résultats des tests de référence
Le développeur a testé les mêmes 5 prompts avec et sans le fichier :
- Expliquer async/await : 180 mots → 65 mots (réduction de 64 %)
- Revue de code : 120 mots → 30 mots (réduction de 75 %)
- Qu'est-ce qu'une API REST : 110 mots → 55 mots (réduction de 50 %)
- Test d'hallucination : 55 mots → 20 mots (réduction de 64 %)
- Total : 465 mots → 170 mots (réduction de 63 %)
Le développeur note que les réponses conservent la même précision technique - simplement sans le superflu.
Implémentation et profils
La solution ne nécessite qu'un seul fichier placé à la racine de votre projet, sans modification de code. Elle comprend trois profils pour différents cas d'utilisation :
- CLAUDE.coding.md - pour les projets de développement et la revue de code
- CLAUDE.agents.md - pour les pipelines d'automatisation et les bots
- CLAUDE.analysis.md - pour le travail de données et de recherche
L'outil est basé sur de vrais problèmes GitHub (y compris le #3382 avec plus de 350 votes positifs) et des recherches communautaires. Le dépôt est ouvert aux PR et contributions de profils, le développeur encourageant les utilisateurs à ouvrir des issues pour tout comportement gênant qu'ils souhaitent voir corrigé.
📖 Read the full source: r/ClaudeAI
👀 See Also

OpenTidy : Assistant d'arrière-plan Open Source utilisant Claude Code pour les tâches administratives
OpenTidy est un service open-source pour macOS qui lance des sessions persistantes de Claude Code pour gérer des tâches administratives telles que les factures, les formulaires et le tri des communications. Il exécute jusqu'à 10 tâches parallèles avec des notifications Telegram pour les actions sensibles.

Membase : Couche de mémoire externe pour assistants IA à travers les outils
Membase est une couche de mémoire externe qui extrait et stocke le contexte des conversations dans un graphe de connaissances, puis injecte les souvenirs pertinents dans les nouveaux chats sur Claude, ChatGPT, Cursor, Gemini et d'autres outils d'IA. Il est actuellement en bêta privée avec toutes les fonctionnalités gratuites.

BrightBean Studio : Plateforme open-source de gestion des médias sociaux développée avec des agents IA
BrightBean Studio est une plateforme de gestion des médias sociaux open-source et auto-hébergeable qui prend en charge plus de 10 plateformes avec des intégrations directes d'API de première partie. Elle a été construite en 3 semaines en utilisant Claude et Codex.

Test du Qwen 3.6 27B local en tant que co-agent validateur Codex
Un développeur a créé une suite d'évaluation reproductible pour tester les profils GGUF de Qwen 3.6 27B (llama.cpp) en tant que validateur secondaire pour Codex, constatant que les profils avec contexte 128k sont nécessaires pour les tâches long-contexte et qu'il y a une perte de précision minimale avec le cache KV q8.