Enruta Claude Code a través de Ollama y reduce tu factura ~90%

Este repositorio de Coherence Daddy proporciona una configuración completa para enrutar las sesiones de terminal de Claude Code a través de una instancia local de Ollama, mientras mantiene Claude Desktop en el nivel pago Pro de Anthropic. El resultado: una reducción del ~90% en los costos de API de Claude Code.
Cómo funciona
Ejecutas dos motores en paralelo:
- Claude Desktop (Anthropic) – utilizado para estrategia, arquitectura, revisión de código y errores difíciles.
- Claude Code → Ollama – utilizado para lints, refactorizaciones, ediciones repetitivas, operaciones por lotes de archivos y tareas de buscar y reemplazar. Se ejecuta en un modelo gratuito de código abierto (Gemma, Qwen, DeepSeek, tú eliges).
Proceso de configuración
El repositorio incluye una presentación HTML autocontenida (21 diapositivas) con un prompt de copiar y pegar que realiza ~98% de la configuración automáticamente. Detecta automáticamente tu sistema operativo (macOS, Windows + WSL2, Linux), instala todo, configura el enrutador y verifica ambos motores al final.
Para ejecutar localmente:
git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html # macOS, o arrastra al navegadorO usa directamente el prompt de copiar y pegar desde prompts/copy-paste-prompt.md.
Estructura del repositorio
prompts/copy-paste-prompt.md– el prompt de configuración.presentation/index.html– presentación visual completa (no requiere paso de compilación).- También alojado en coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.
Por qué existe esto
Claude Pro en el escritorio es excelente para pensar y arquitectura, pero Claude Code en la terminal consume rápidamente la cuota en tareas con mucho contexto. Enrutar esas tareas a través de Ollama (modelos gratuitos locales o en la nube) mantiene la misma experiencia de usuario pero a una fracción del costo.
Licencia
MIT – libre de usar, bifurcar o remezclar.
📖 Lee la fuente original: HN AI Agents
👀 Ver también

OpenClaw 4.1 con Gemma 4 Stack: Arquitectura Híbrida y Correcciones de Configuración
Una publicación de Reddit detalla una pila de agentes locales optimizada que combina OpenClaw 4.1 con el modelo Gemma 4 de Google, con una arquitectura híbrida, correcciones de configuración específicas para la llamada a herramientas de Ollama y ajustes en la ventana de contexto.

Guía Práctica para Alojar Tu Primer LLM en tu Propio Servidor
Una publicación de Reddit describe las razones para autoalojar LLMs, incluyendo privacidad para datos sensibles, previsibilidad de costos para cargas de trabajo de agentes, mejoras de rendimiento al eliminar viajes de ida y vuelta a la API, y personalización mediante métodos de ajuste fino como LoRA y QLoRA.

Instalación de OpenClaw en MacBook Pro Usando Homebrew Local y NVM
Un usuario instaló exitosamente OpenClaw en un MacBook Pro utilizando una cuenta sin privilegios de administrador con Homebrew local, NVM v0.40.4, Python 3.14.3 mediante pyenv, Node 24 y el modelo de lenguaje grande Qwen3.5-122B-A10B-MLX-vision-4.7-bit a través de oMLX.

Optimización de la Configuración de OpenClaw: Patrones e Ideas Prácticas
Los usuarios de OpenClaw comparten patrones de configuración efectivos, como el uso de cron para tareas programadas y la creación de subagentes especializados, para mejorar la funcionalidad y la eficiencia de costos.