Roteie o Claude Code pelo Ollama e Corte Sua Conta em ~90%

Este repositório, criado por Coherence Daddy, fornece uma configuração completa para rotear sessões do terminal do Claude Code através de uma instância local do Ollama, mantendo o Claude Desktop no plano Pro pago da Anthropic. O resultado: uma redução alegada de ~90% nos custos da API do Claude Code.
Como Funciona
Você executa dois mecanismos lado a lado:
- Claude Desktop (Anthropic) – usado para estratégia, arquitetura, revisão de código e bugs complexos.
- Claude Code → Ollama – usado para lints, refatorações, edições repetitivas, operações em lote de arquivos e tarefas de grep-and-replace. Roda em um modelo gratuito de código aberto (Gemma, Qwen, DeepSeek, à sua escolha).
Processo de Configuração
O repositório inclui uma apresentação HTML autossuficiente (21 slides) com um prompt copiável que faz ~98% da configuração automaticamente. Ele detecta automaticamente seu sistema operacional (macOS, Windows + WSL2, Linux), instala tudo, configura o roteador e verifica ambos os mecanismos ao final.
Para executar localmente:
git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html # macOS, ou arraste para o navegadorOu use diretamente o prompt copiável de prompts/copy-paste-prompt.md.
Estrutura do Repositório
prompts/copy-paste-prompt.md– o prompt de configuração.presentation/index.html– apresentação visual completa (sem necessidade de build).- Também hospedado em coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.
Por Que Isso Existe
O Claude Pro no desktop é ótimo para pensar e arquitetar, mas o Claude Code no terminal consome rapidamente a cota em tarefas com muito contexto. Roteando essas tarefas através do Ollama (modelos gratuitos locais ou hospedados na nuvem) mantém a mesma experiência do usuário, mas por uma fração do custo.
Licença
MIT – livre para usar, bifurcar ou remixar.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Começando com o OpenCode para Configuração de Agente de IA de Codificação Local
Um guia para iniciantes percorre a configuração do OpenCode como um agente de codificação de IA totalmente local usando os modelos otimizados da ByteShape com LM Studio, llama.cpp ou Ollama em Mac, Linux e Windows (WSL2).

Visual do Fluxo de Trabalho do Claude Code: Hierarquia de Memória, Habilidades, Ganchos e Loop
Um post no Reddit compartilha um fluxo de trabalho visual para o Claude Code, cobrindo camadas de memória (global → repositório → escopo), habilidades como padrões reutilizáveis em .claude/skills/ e um ciclo de trabalho sugerido (planejar → descrever → aceitar → commitar).

Lista de configuração do OpenClaw: seis etapas críticas para novos usuários
Uma postagem no Reddit descreve seis passos essenciais de configuração para usuários do OpenClaw: mudar o modelo padrão de Opus para Sonnet para reduzir custos, bloquear o host do gateway para 127.0.0.1 por segurança, criar SOUL.md para personalidade do agente, evitar instalar habilidades inicialmente, não criar múltiplos agentes e usar o comando /new para gerenciar o contexto da conversa.

Construindo uma Ponte para Dois Bots do Telegram em um Único Chat de Grupo: Semântica de Entrega via HTTP
Um desenvolvedor compartilha uma abordagem prática para conectar dois bots independentes do Telegram no mesmo chat em grupo, lidando com as falhas de entrega bot-para-bot do Telegram usando relays HTTP, ACKs, deduplicação e feeds estritamente delimitados.