engram v3.4.0 ajoute un plugin Anthropic pour maintenir le fonctionnement de Claude Code sous les nouvelles limites de débit

engram v3.4.0 répond aux récentes réductions de limites de débit et à la suppression imminente de Claude Code de l'offre Pro en exposant un plugin dédié à Anthropic. Le plugin regroupe une configuration de serveur MCP qui instancie localement une couche mémoire partagée, survivant aux modifications de fichiers et aux changements d'IDE sans latence supplémentaire.
Fonctionnalités clés
- Trois nouvelles compétences accessibles via des commandes slash dans Claude Code :
/engram:costpour les requêtes de dépenses de tokens,/engram:querypour une récupération rapide du contexte, et/engram:mistakespour faire remonter les erreurs d'exécution récentes. - Intégration MCP sans configuration — le serveur MCP s'exécute localement, donc la colonne vertébrale du contexte est instanciée la première fois qu'une compétence est utilisée, sans configuration supplémentaire.
- Persistance multi-IDE — la couche mémoire partagée persiste lors des modifications de fichiers et même entre différents IDE, assurant une continuité.
Installation
CLI (une ligne) :
npm install -g engramx@latest engram setup # détecte automatiquement Claude Code
Via le marketplace Claude Code : Une fois la liste apparue, exécutez /plugin install engram.
Ce qu'il résout
Les utilisateurs de Claude Code ont subi des réductions soudaines de limites de débit avec la suppression imminente du produit de l'offre Pro. Le plugin d'engram fournit une couche mémoire locale sans latence qui aide à gérer la consommation d'API (via les requêtes de coût) et à récupérer rapidement des erreurs (via le signalement d'erreurs). Le serveur MCP s'exécute localement, donc aucune dépendance externe n'est introduite.
À qui s'adresse-t-il ?
Développeurs qui comptent sur Claude Code et doivent contourner des limites de débit plus strictes tout en maintenant une continuité entre les sessions.
Ressources
- Code source et problèmes : github.com/NickCirv/engram
- Package npm :
engramx
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Évaluation de Nemotron 3 Super 120B avec un contexte de 1 million de tokens sur M1 Ultra
Un utilisateur a testé Nemotron 3 Super 120B avec un modèle quantifié Q4_K_M en utilisant llama.cpp sur un M1 Ultra, atteignant une fenêtre de contexte d'un million de tokens qui a consommé environ 90 Go de VRAM. Les benchmarks de performance montrent des vitesses de génération de tokens allant de 255 t/s pour un traitement de prompt de 512 tokens jusqu'à 22,37 t/s pour un contexte de 100 000 tokens.

Compétences de Claude pour Émuler un Environnement de Studio de Design
Un designer partage deux compétences Claude : l'une simule un studio avec des coéquipiers et des méthodes de conception, l'autre ajoute un 'jeu rigoureux' pour la créativité.

Construire un système de connaissances auto-améliorant avec Claude Code et Obsidian
Un développeur a créé un système de 25 outils qui confère à Claude Code une mémoire persistante grâce à la recherche sémantique, aux graphes de connaissances et à la répétition espacée sur un coffre Obsidian. Le système indexe le contenu avec des embeddings bge-m3, détecte les contradictions, élagage automatique des notes obsolètes et génère automatiquement des cartes Obsidian Canvas.

Solitaire : Couche d'Identité Open-Source pour Agents IA Construite avec Claude Code
Solitaire est une couche d'identité open source pour les agents d'IA qui évolue par l'interaction plutôt que par une configuration statique. Il a été testé sur plus de 600 sessions en production et stocke toutes les données localement en utilisant SQLite + JSONL sans dépendances cloud.