Réducteur de Tokens : Un Plugin Claude Code pour la Compression Intelligente du Contexte

Token Reducer est un plugin Claude Code qui résout le problème de consommation excessive de tokens lors du travail avec des dépôts de taille moyenne à grande. L'outil traite le contexte du dépôt localement avant de l'envoyer à Claude, réduisant considérablement la taille du contexte sans perdre le code pertinent.
Fonctionnement
Le plugin utilise plusieurs techniques pour compresser intelligemment le contexte :
- Découpage basé sur AST — Analyse le code en unités significatives (fonctions, classes, blocs) au lieu d'un simple découpage textuel
- Récupération hybride — Combine BM25 (correspondance de mots-clés) avec la similarité vectorielle pour trouver les segments les plus pertinents
- Compression TextRank — Applique une synthèse extractive pour conserver les parties importantes et éliminer le bruit
- Cartographie du graphe d'import — Trace les dépendances pour que le code lié reste ensemble
- Expansion de symboles à 2 sauts — Lorsqu'on travaille sur une fonction A qui appelle une fonction B, elle inclut automatiquement le contexte de B
Performances et tests
Lors des tests sur des dépôts Python, TypeScript et JavaScript, le développeur rapporte une réduction de 90 à 98 % de la taille du contexte sans perte du code pertinent pour la tâche. L'outil a été construit en utilisant Claude lui-même pour itérer sur l'architecture, en commençant par un découpeur basique et en testant sur des tâches de codage réelles jusqu'à obtenir une compression serrée mais préservant le contexte.
Installation et disponibilité
Token Reducer est entièrement gratuit et sous licence MIT. Pour l'installer :
/plugin marketplace add Madhan230205/token-reducer
Le code source est disponible sur GitHub à github.com/Madhan230205/token-reducer. Le développeur sollicite des retours sur les cas où la compression aide les flux de travail, les situations où un contexte important est perdu, et les langages ou structures de dépôt nécessitant une meilleure prise en charge.
Détails techniques
Le plugin fonctionne entièrement localement, sans API cloud et sans que les données ne quittent votre machine. Il a été empaqueté en tant que plugin Claude Code après avoir fonctionné de manière fiable sur les propres projets du développeur. Le dépôt est ouvert aux contributions, avec de la place pour optimiser pour différents langages, ajouter une mise en cache plus intelligente ou ajuster les paramètres de récupération.
📖 Read the full source: r/ClaudeAI
👀 See Also

agentmemory V4 atteint 96,2 % au benchmark LongMemEval, surpassant les systèmes de mémoire d'IA commerciaux.
agentmemory V4 a obtenu un score de 96,2 % sur LongMemEval, surpassant plusieurs entreprises d'IA à mémoire financées, notamment PwC Chronos (95,6 %), Mastra (94,87 %) et OMEGA (93,2 %). Le système a été développé seul en 16 jours sur un PC gaming milieu de gamme avec un budget de 1 000 $.

soul.py ajoute une mémoire persistante aux LLM locaux avec une approche simple basée sur des fichiers.
soul.py est une bibliothèque Python qui ajoute une mémoire persistante à tout LLM en utilisant deux fichiers markdown pour l'identité et la journalisation des conversations, fonctionnant avec les modèles Ollama, OpenAI et Anthropic sans nécessiter de bases de données ou de serveurs.

Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI
Le Principe de Capacité de Charge v9 est un cadre structurel bidirectionnel qui utilise une seule image de diagramme de flux au lieu d'invites textuelles pour Claude IA. Il fournit un diagnostic structurel ou des plans de construction génératifs basés sur les paramètres du système ou les objectifs.

Cage à homard : Environnement de sécurité conteneurisé pour l'auto-hébergement d'OpenClaw sur Raspberry Pi
Un développeur a créé Lobster Cage, un environnement Docker Compose avec un accès sortant restreint et un routage basé sur un proxy pour exécuter OpenClaw de manière sécurisée sur un Raspberry Pi à des fins d'expérimentation.