Roteie Claude Code pelo Ollama: Corte 90% da Conta

Este repositório, criado por Coherence Daddy, fornece uma configuração completa para rotear sessões do terminal do Claude Code através de uma instância local do Ollama, mantendo o Claude Desktop no plano Pro pago da Anthropic. O resultado: uma redução alegada de ~90% nos custos da API do Claude Code.

Como Funciona

Você executa dois mecanismos lado a lado:

Claude Desktop (Anthropic) – usado para estratégia, arquitetura, revisão de código e bugs complexos.
Claude Code → Ollama – usado para lints, refatorações, edições repetitivas, operações em lote de arquivos e tarefas de grep-and-replace. Roda em um modelo gratuito de código aberto (Gemma, Qwen, DeepSeek, à sua escolha).

Processo de Configuração

O repositório inclui uma apresentação HTML autossuficiente (21 slides) com um prompt copiável que faz ~98% da configuração automaticamente. Ele detecta automaticamente seu sistema operacional (macOS, Windows + WSL2, Linux), instala tudo, configura o roteador e verifica ambos os mecanismos ao final.

Para executar localmente:

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, ou arraste para o navegador

Ou use diretamente o prompt copiável de prompts/copy-paste-prompt.md.

Estrutura do Repositório

prompts/copy-paste-prompt.md – o prompt de configuração.
presentation/index.html – apresentação visual completa (sem necessidade de build).
Também hospedado em coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.

Por Que Isso Existe

O Claude Pro no desktop é ótimo para pensar e arquitetar, mas o Claude Code no terminal consome rapidamente a cota em tarefas com muito contexto. Roteando essas tarefas através do Ollama (modelos gratuitos locais ou hospedados na nuvem) mantém a mesma experiência do usuário, mas por uma fração do custo.