Economize nas Contas do Claude Code Roteando Tokens de Planejamento para Modelos Mais Baratos

Um usuário do Reddit relata ter economizado cerca de US$ 40 em taxas de excesso no Claude Code no mês passado ao dividir o uso de tokens entre modelos. A principal descoberta: etapas de planejamento (especialmente em refatorações de vários arquivos) podem consumir até 80% do orçamento de tokens, mas a maior parte do planejamento não precisa do modelo mais caro.
Como Funciona
Eles escreveram um wrapper de 30 linhas que roteia o trabalho inicial de 'descobrir o que mudar' para o Haiku 3.5 — um modelo mais barato. Apenas as edições reais e as tomadas de decisão permanecem no Opus ou Sonnet. A configuração levou cerca de 2 horas, incluindo descobrir quais etapas valiam a pena delegar.
Resultados
O último ciclo terminou com orçamento sobrando pela primeira vez em 4 meses. O usuário evitou a espera habitual de 2 dias pela janela de redefinição. Economia: aproximadamente US$ 40 em taxas de excesso.
# Pseudocódigo para a lógica do wrapper:
# 1. Enviar prompt de planejamento para haiku-3.5
# 2. Receber uma lista de arquivos e alterações
# 3. Passar o plano + instrução para opus/sonnet para edições reais
Ressalvas
A qualidade do planejamento do Haiku é visivelmente pior em decisões de arquitetura. Para fluxos de refatoração e teste, onde o Opus assume as decisões reais de qualquer forma, funciona bem. Para design do zero ('o que esse aplicativo deveria ser'), o usuário ainda deixa o Opus planejar do início.
O usuário observa que esse padrão é 'provavelmente óbvio para quem já olhou as tabelas de preços dos modelos do OpenRouter', mas a documentação dos subagentes do Claude Code é escassa sobre essa abordagem exata.
📖 Leia a fonte original: r/ClaudeAI
👀 See Also

Reduzir os Tokens de Boot OpenClaw em 43% ao Redimensionar Ferramenta e Arquivos de Memória
Reduziu os tokens de inicialização de ~9.457 para ~5.400 (queda de 43%) ao converter TOOLS.md em um índice, mover detalhes das ferramentas para arquivos separados e implementar promoção de memória em estágios.

OpenClaw no M4 Pro: Encontrando Barreiras com Uso de Navegador, Uso de Computador e Codex
Um usuário relata agentes presos em loops de terminal, sendo bloqueados em sites e saídas do Codex quebradas, buscando ajustes de configuração para o navegador de automação, controle de GUI do macOS e loops de interrupção.

Um Fluxo de Trabalho de IA em Duas Etapas para Modernização de Código Legado
Uma postagem no Reddit descreve uma abordagem de 'engenharia reversa' em duas etapas para usar IA com código legado: primeiro extrair a lógica de negócios em um Documento de Requisitos de Negócios independente de tecnologia, depois usar um prompt de 'Arquiteto Mestre' para reconstruir do zero com as melhores práticas modernas.

Adicione uma Linha ao CLAUDE.md para Obter Listas de Verificação Decoradas com Emoji no Claude
Adicione um conjunto de marcadores de uma linha ao seu CLAUDE.md de nível de usuário para fazer o Claude decorar listas de verificação com emojis de status — 14 ícones fixos para concluído, em execução, falhou, bloqueado, etc.