Reduce ~90% factura: Enruta Claude Code con Ollama

Este repositorio de Coherence Daddy proporciona una configuración completa para enrutar las sesiones de terminal de Claude Code a través de una instancia local de Ollama, mientras mantiene Claude Desktop en el nivel pago Pro de Anthropic. El resultado: una reducción del ~90% en los costos de API de Claude Code.

Cómo funciona

Ejecutas dos motores en paralelo:

Claude Desktop (Anthropic) – utilizado para estrategia, arquitectura, revisión de código y errores difíciles.
Claude Code → Ollama – utilizado para lints, refactorizaciones, ediciones repetitivas, operaciones por lotes de archivos y tareas de buscar y reemplazar. Se ejecuta en un modelo gratuito de código abierto (Gemma, Qwen, DeepSeek, tú eliges).

Proceso de configuración

El repositorio incluye una presentación HTML autocontenida (21 diapositivas) con un prompt de copiar y pegar que realiza ~98% de la configuración automáticamente. Detecta automáticamente tu sistema operativo (macOS, Windows + WSL2, Linux), instala todo, configura el enrutador y verifica ambos motores al final.

Para ejecutar localmente:

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, o arrastra al navegador

O usa directamente el prompt de copiar y pegar desde prompts/copy-paste-prompt.md.

Estructura del repositorio

prompts/copy-paste-prompt.md – el prompt de configuración.
presentation/index.html – presentación visual completa (no requiere paso de compilación).
También alojado en coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.

Por qué existe esto

Claude Pro en el escritorio es excelente para pensar y arquitectura, pero Claude Code en la terminal consume rápidamente la cuota en tareas con mucho contexto. Enrutar esas tareas a través de Ollama (modelos gratuitos locales o en la nube) mantiene la misma experiencia de usuario pero a una fracción del costo.