Le plugin MCP de mise en cache des invites réduit automatiquement les coûts de l'API Claude en identifiant le contexte stable.

✍️ OpenClawRadar📅 Publié: March 13, 2026🔗 Source
Le plugin MCP de mise en cache des invites réduit automatiquement les coûts de l'API Claude en identifiant le contexte stable.
Ad

La mise en cache des prompts est un plugin MCP qui réduit automatiquement les coûts de l'API Claude en exploitant la fonctionnalité de mise en cache d'Anthropic. Lorsque vous utilisez Claude Code ou Cursor/Windsurf/Zed avec l'API Anthropic, chaque tour envoie généralement tout le contexte depuis le début, ce qui signifie que des milliers de tokens sont facturés au tarif plein à plusieurs reprises lors de longues sessions de débogage.

Fonctionnement

Anthropic propose une fonctionnalité de mise en cache qui fait que les lectures répétées coûtent 0,1× au lieu de 1×, mais cela nécessite de marquer manuellement ce qui est mis en cache. Le plugin de mise en cache des prompts fonctionne en arrière-plan, identifie les parties stables de votre contexte (prompts système, définitions d'outils, lectures de fichiers volumineux) et les marque automatiquement avant chaque appel API.

Ad

Résultats de performance

  • Correction de bug en 20 tours : 85 % moins cher
  • Refactorisation en 15 tours : 80 % moins cher
  • Session de codage en 40 tours : 92 % moins cher

Installation

Pour les utilisateurs de Claude Code :

/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis

Pour Cursor/Windsurf/Zed :

npm install -g prompt-caching-mcp

Puis pointez votre configuration MCP vers celui-ci.

L'outil est open source sous licence MIT et disponible gratuitement. Le dépôt se trouve à https://github.com/flightlesstux/prompt-caching.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Homme des cavernes : Une Compétence de Code Claude Qui Réduit de 75 % les Tokens en Utilisant un Discours de Style Homme des Cavernes
Tools

Homme des cavernes : Une Compétence de Code Claude Qui Réduit de 75 % les Tokens en Utilisant un Discours de Style Homme des Cavernes

Caveman est une compétence Claude Code qui réduit l'utilisation de tokens d'environ 75 % en faisant répondre Claude dans un style concis, semblable à celui d'un homme des cavernes, tout en conservant une précision technique complète. Il est installé via npx ou le marché des plugins Claude.

OpenClawRadar
LLM Circuit Finder : Dupliquez 3 couches pour renforcer le raisonnement sans entraînement
Tools

LLM Circuit Finder : Dupliquez 3 couches pour renforcer le raisonnement sans entraînement

Un nouvel outil identifie des 'circuits de raisonnement' dans les modèles de transformateurs - des blocs contigus de 3-4 couches qui agissent comme des unités cognitives indivisibles. Dupliquer ces blocs (couches 12-14 dans Devstral-24B) améliore le raisonnement déductif de 0,22 à 0,76 sur les benchmarks BBH sans modification des poids ni entraînement.

OpenClawRadar
Patina : Une Compétence Claude Code qui Détecte et Réécrit les Modèles d'Écriture IA
Tools

Patina : Une Compétence Claude Code qui Détecte et Réécrit les Modèles d'Écriture IA

Un développeur a créé une compétence Claude Code appelée patina qui identifie 112 motifs rendant le texte généré par IA évident dans quatre langues, puis réécrit les sections signalées. L'outil inclut des modes pour la détection uniquement, l'évaluation et la réécriture itérative.

OpenClawRadar
Encre : Une plateforme de déploiement où les agents IA Claude sont les utilisateurs principaux
Tools

Encre : Une plateforme de déploiement où les agents IA Claude sont les utilisateurs principaux

Ink (ml.ink) est une plateforme de déploiement conçue pour les agents d'IA comme Claude, offrant un déploiement par simple appel d'outil, une détection automatique des frameworks, et des services intégrés incluant le calcul, les bases de données, le DNS, les secrets, les domaines, les métriques et les journaux.

OpenClawRadar