Reduza Custos do Claude Code: Roteie Planejamento para Haiku 3.5

Um usuário do Reddit relata ter economizado cerca de US$ 40 em taxas de excesso no Claude Code no mês passado ao dividir o uso de tokens entre modelos. A principal descoberta: etapas de planejamento (especialmente em refatorações de vários arquivos) podem consumir até 80% do orçamento de tokens, mas a maior parte do planejamento não precisa do modelo mais caro.

Como Funciona

Eles escreveram um wrapper de 30 linhas que roteia o trabalho inicial de 'descobrir o que mudar' para o Haiku 3.5 — um modelo mais barato. Apenas as edições reais e as tomadas de decisão permanecem no Opus ou Sonnet. A configuração levou cerca de 2 horas, incluindo descobrir quais etapas valiam a pena delegar.

Resultados

O último ciclo terminou com orçamento sobrando pela primeira vez em 4 meses. O usuário evitou a espera habitual de 2 dias pela janela de redefinição. Economia: aproximadamente US$ 40 em taxas de excesso.

# Pseudocódigo para a lógica do wrapper:
# 1. Enviar prompt de planejamento para haiku-3.5
# 2. Receber uma lista de arquivos e alterações
# 3. Passar o plano + instrução para opus/sonnet para edições reais

Ressalvas

A qualidade do planejamento do Haiku é visivelmente pior em decisões de arquitetura. Para fluxos de refatoração e teste, onde o Opus assume as decisões reais de qualquer forma, funciona bem. Para design do zero ('o que esse aplicativo deveria ser'), o usuário ainda deixa o Opus planejar do início.

O usuário observa que esse padrão é 'provavelmente óbvio para quem já olhou as tabelas de preços dos modelos do OpenRouter', mas a documentação dos subagentes do Claude Code é escassa sobre essa abordagem exata.

📖 Leia a fonte original: r/ClaudeAI

Economize nas Contas do Claude Code Roteando Tokens de Planejamento para Modelos Mais Baratos

Como Funciona

Resultados

Ressalvas

👀 See Also

100K Linhas de Rust com IA: Contratos, Desenvolvimento Orientado por Especificações e Performance

Correções no Harness de Verificação Resolvem o Problema de Execução do Plano do Claude

Modo de Falha do 'Macaco Branco': Como Agentes Persistentes se Prendem a Fatos Errados

Colaborativo vs Diretivo: Prompts de IA Produzem Resultados Diferentes