Réduire de 90% votre facture Claude Code via Ollama

Ce repo de Coherence Daddy propose une configuration complète pour router les sessions terminal de Claude Code via une instance Ollama locale, tout en gardant Claude Desktop sur le niveau payant Pro d'Anthropic. Résultat : une réduction annoncée d'environ 90 % des coûts d'API de Claude Code.

Comment ça marche

Vous exécutez deux moteurs côte à côte :

Claude Desktop (Anthropic) – utilisé pour la stratégie, l'architecture, la revue de code et les bugs complexes.
Claude Code → Ollama – utilisé pour les lints, refactorisations, modifications répétitives, opérations par lots sur fichiers et tâches de recherche-remplacement. Tourne sur un modèle open-source gratuit (Gemma, Qwen, DeepSeek, au choix).

Processus de configuration

Le repo inclut une présentation HTML autonome (21 diapositives) avec une invite copier-coller qui effectue environ 98 % de la configuration automatiquement. Elle détecte votre OS (macOS, Windows + WSL2, Linux), installe tout, configure le routeur et vérifie les deux moteurs à la fin.

Pour exécuter localement :

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, ou glisser-déposer dans le navigateur

Ou utilisez directement l'invite copier-coller depuis prompts/copy-paste-prompt.md.

Structure du dépôt

prompts/copy-paste-prompt.md – l'invite de configuration.
presentation/index.html – le deck visuel complet (aucune étape de build nécessaire).
Également hébergé sur coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.

Pourquoi ça existe

Claude Pro sur le bureau est génial pour la réflexion et l'architecture, mais Claude Code dans le terminal consomme rapidement le quota sur les tâches gourmandes en contexte. Router ces tâches via Ollama (modèles gratuits locaux ou hébergés dans le cloud) conserve la même expérience utilisateur mais à une fraction du coût.