Enruta Claude Code a través de Ollama y reduce tu factura ~90%

✍️ OpenClawRadar📅 Publicado: 27 de abril de 2026🔗 Source
Enruta Claude Code a través de Ollama y reduce tu factura ~90%
Ad

Este repositorio de Coherence Daddy proporciona una configuración completa para enrutar las sesiones de terminal de Claude Code a través de una instancia local de Ollama, mientras mantiene Claude Desktop en el nivel pago Pro de Anthropic. El resultado: una reducción del ~90% en los costos de API de Claude Code.

Cómo funciona

Ejecutas dos motores en paralelo:

  • Claude Desktop (Anthropic) – utilizado para estrategia, arquitectura, revisión de código y errores difíciles.
  • Claude Code → Ollama – utilizado para lints, refactorizaciones, ediciones repetitivas, operaciones por lotes de archivos y tareas de buscar y reemplazar. Se ejecuta en un modelo gratuito de código abierto (Gemma, Qwen, DeepSeek, tú eliges).

Proceso de configuración

El repositorio incluye una presentación HTML autocontenida (21 diapositivas) con un prompt de copiar y pegar que realiza ~98% de la configuración automáticamente. Detecta automáticamente tu sistema operativo (macOS, Windows + WSL2, Linux), instala todo, configura el enrutador y verifica ambos motores al final.

Para ejecutar localmente:

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, o arrastra al navegador

O usa directamente el prompt de copiar y pegar desde prompts/copy-paste-prompt.md.

Ad

Estructura del repositorio

Por qué existe esto

Claude Pro en el escritorio es excelente para pensar y arquitectura, pero Claude Code en la terminal consume rápidamente la cuota en tareas con mucho contexto. Enrutar esas tareas a través de Ollama (modelos gratuitos locales o en la nube) mantiene la misma experiencia de usuario pero a una fracción del costo.

Licencia

MIT – libre de usar, bifurcar o remezclar.

📖 Lee la fuente original: HN AI Agents

Ad

👀 Ver también

OpenClaw 4.1 con Gemma 4 Stack: Arquitectura Híbrida y Correcciones de Configuración
Guías

OpenClaw 4.1 con Gemma 4 Stack: Arquitectura Híbrida y Correcciones de Configuración

Una publicación de Reddit detalla una pila de agentes locales optimizada que combina OpenClaw 4.1 con el modelo Gemma 4 de Google, con una arquitectura híbrida, correcciones de configuración específicas para la llamada a herramientas de Ollama y ajustes en la ventana de contexto.

OpenClawRadar
Guía Práctica para Alojar Tu Primer LLM en tu Propio Servidor
Guías

Guía Práctica para Alojar Tu Primer LLM en tu Propio Servidor

Una publicación de Reddit describe las razones para autoalojar LLMs, incluyendo privacidad para datos sensibles, previsibilidad de costos para cargas de trabajo de agentes, mejoras de rendimiento al eliminar viajes de ida y vuelta a la API, y personalización mediante métodos de ajuste fino como LoRA y QLoRA.

OpenClawRadar
Instalación de OpenClaw en MacBook Pro Usando Homebrew Local y NVM
Guías

Instalación de OpenClaw en MacBook Pro Usando Homebrew Local y NVM

Un usuario instaló exitosamente OpenClaw en un MacBook Pro utilizando una cuenta sin privilegios de administrador con Homebrew local, NVM v0.40.4, Python 3.14.3 mediante pyenv, Node 24 y el modelo de lenguaje grande Qwen3.5-122B-A10B-MLX-vision-4.7-bit a través de oMLX.

OpenClawRadar
Optimización de la Configuración de OpenClaw: Patrones e Ideas Prácticas
Guías

Optimización de la Configuración de OpenClaw: Patrones e Ideas Prácticas

Los usuarios de OpenClaw comparten patrones de configuración efectivos, como el uso de cron para tareas programadas y la creación de subagentes especializados, para mejorar la funcionalidad y la eficiencia de costos.

OpenClawRadar