Prefex : Proxy local pour mise en cache Claude Code

Prefex est un outil proxy local conçu pour réduire les coûts d'API lors de l'utilisation de Claude Code. Il traite deux inefficacités spécifiques en matière de coûts : la fonctionnalité bêta de mise en cache des prompts d'Anthropic nécessite une injection manuelle d'en-tête, et Claude Code envoie l'historique complet des conversations avec chaque requête.

Fonctionnement

Prefex s'exécute entièrement sur votre machine locale en tant que proxy entre Claude Code et l'API d'Anthropic. Il injecte automatiquement l'en-tête spécifique nécessaire pour activer la fonctionnalité de mise en cache des prompts d'Anthropic, ce qui réduit les coûts des jetons d'entrée répétés de 90 %. Sans cet en-tête, toutes les requêtes, y compris votre CLAUDE.md et le contexte du projet, sont facturées au prix plein.

L'outil implémente également une mémoire de session, empêchant Claude Code de renvoyer l'intégralité de l'historique des conversations à chaque tour. De plus, il inclut un routeur de modèles qui peut acheminer les requêtes plus simples vers des modèles moins chers, bien que cette fonctionnalité n'était pas active pendant la période de test initiale.

Performance et Installation

Lors d'un test de 4 jours avec une utilisation normale :

1 338 requêtes traitées
49,60 $ de coût réel avec Prefex
348 $ de coût estimé sans Prefex
86 % d'économies réalisées (avec mise en cache uniquement, sans routage de modèles)

Le développeur fournit un benchmark qui exécute 5 questions sur karpathy/nanoGPT avec des démarrages à froid et à chaud, coûtant environ 0,03 $. Les calculs de coût utilisent les champs de facturation réels d'Anthropic.

L'installation nécessite une commande curl et l'ajout d'une ligne dans settings.json. Le package inclut un script de désinstallation. L'outil fonctionne localement sans serveurs externes, sans télémétrie, et les clés API vont directement à Anthropic.

📖 Lire la source complète : r/ClaudeAI

Prefex : Un proxy local pour Claude Code qui automatise la mise en cache des invites et la mémoire de session

Fonctionnement

Performance et Installation

👀 See Also

Zeude : Tableau de bord d'auto-hébergement pour le code Claude et le code OpenAI Codex

Système ACO : Pipeline multi-agents open source du ticket GitHub à la PR fusionnée

MCP Marketplace lance un répertoire sécurisé de plus de 1 900 plugins d'outils MCP.

civStation : Harnais VLM Open-Source pour le Contrôle en Langage Naturel de Civilization VI

Fonctionnement

Performance et Installation

👀 See Also

Zeude : Tableau de bord d'auto-hébergement pour le code Claude et le code OpenAI Codex

Système ACO : Pipeline multi-agents open source du ticket GitHub à la PR fusionnée

MCP Marketplace lance un répertoire sécurisé de plus de 1 900 plugins d'outils MCP.

civStation : Harnais VLM Open-Source pour le Contrôle en Langage Naturel de Civilization VI

MCP Marketplace lance un répertoire sécurisé de plus de 1 900 plugins d'outils MCP.