Réduisez de 90 % les coûts d'IA avec l'indexation par graphes

Un utilisateur de Reddit rapporte dépenser 2 à 6 dollars par requête sur Claude Code, car le modèle relit des dizaines de fichiers à chaque session. Même avec la mise en cache (70 % des tokens provenant du cache avec 90 % de réduction), le cache se réinitialise à chaque session. La solution : un serveur local qui indexe le codebase dans une base de données graphe, interrogée via le Model Context Protocol (MCP) au lieu de lectures brutes de fichiers.

Comment ça marche

Au lieu d'analyse AST ou d'embeddings vectoriels, l'outil utilise un LLM pour générer un objectif, un résumé et un contexte métier pour chaque fichier, ainsi que des liens vers ses fonctions, classes et imports.
Le graphe est exposé via un serveur MCP ; Claude interroge le graphe pour des recherches ciblées (2 à 4 nœuds par question) au lieu de vider l'intégralité du dépôt dans le contexte.
Les coûts de session sont passés de dollars à centimes. L'approche fonctionne aussi bien avec des modèles open-source comme DeepSeek-V4 et Kimi-2.6, car c'est la récupération (et non la taille du modèle) qui fait le gros du travail.

Détails de configuration

Tout s'exécute localement, mono-tenant, sans dépendance cloud. Le projet est open-sourcé sur GitHub : github.com/ByteBell/bytebell-oss. L'utilisateur note qu'il n'utilise pas d'analyse AST ou de vecteurs — le graphe est constitué d'analyses de fichiers générées par LLM.

À qui cela s'adresse

Les développeurs utilisant Claude Code (ou tout agent IA facturé au token) sur de grands codebases qui souhaitent réduire les coûts en mettant en cache le contexte structurel entre sessions.

📖 Lire la source complète : r/ClaudeAI

Réduisez de 90 % les coûts des sessions de codage IA avec l'indexation de code basée sur des graphes

Comment ça marche

Détails de configuration

À qui cela s'adresse

👀 See Also

Opendesk : Algorithme MCP + SOM pour le contrôle de bureau par IA via Claude Code

L'application iOS OpenClaw ajoute la synchronisation des données historiques d'Apple Health jusqu'à 18 mois.

OpenCortex : Un système de mémoire auto-améliorant pour OpenClaw

De Replit à Local : Comment un développeur a utilisé Claude pour construire StillHere, une application de chat compagnon IA basée sur API