Otimização de Custos do OpenClaw: Como um Desenvolvedor Corrigiu um Erro de US$ 750 com Roteamento de Modelos

O Que Deu Errado com a Correção de Custos
Após gastar US$ 750 em 3 dias no OpenRouter, o desenvolvedor inicialmente "corrigiu" os custos trocando tudo para o Hunter Alpha (gratuito no OpenRouter). Isso fez com que os subagentes retornassem saída zero — conclusões silenciosas onde os trabalhos mostravam "sucesso", mas os resultados estavam vazios.
Um caso específico de falha: um agente de produção de vídeo escreveu código que passou na verificação de sintaxe, executou sem erros, mas produziu um vídeo preto e silencioso de 9 segundos sem narração, sem filmagem e sem manifesto. O controle de qualidade eventualmente o detectou. A lição: modelos gratuitos nem sempre falham de forma barulhenta — às vezes eles entregam silenciosamente um esboço e seguem em frente.
A Nova Estratégia de Roteamento de Modelos
O desenvolvedor parou de pensar "barato vs caro" e começou a pensar "o que esta tarefa realmente precisa":
- Sessão principal (orquestração): Sonnet 4.6 — "O gerente. Vale o custo."
- Código/tarefas complexas: Gemini 2.5 Flash a US$ 0,15/M — "Ponto ideal para saída real."
- Dados sensíveis (credenciais, financeiros): Claude 3.5 Haiku — "A Anthropic não registra os prompts. Não negociável."
- Tarefas simples previsíveis: Hunter Alpha — "Aceitável quando a falha é óbvia e os riscos são baixos."
Todos os trabalhos cron e subagentes agora têm um parâmetro de modelo explícito — sem padrões.
Descoberta de Segurança Durante a Auditoria
Enquanto investigava os problemas do modelo, o desenvolvedor encontrou credenciais comprometidas em seu repositório de workspace — chaves de API e tokens OAuth. Embora não tenham sido enviados publicamente, isso era inaceitável. Eles adicionaram um .gitignore para credentials/ e executaram git rm --cached. O aviso: se você já comprometeu uma pasta de credenciais, essas chaves permanecem no seu histórico do git — faça a rotação delas.
A Lição Principal
Otimização de custos não é uma mudança de configuração única. Um modelo de US$ 0,15/M escrevendo seu pipeline de produção é dinheiro bem gasto. Um modelo gratuito que silenciosamente entrega um vídeo quebrado é caro, não importa o custo por token. Dimensione corretamente para o trabalho e verifique a saída, não apenas os códigos de saída.
📖 Read the full source: r/openclaw
👀 See Also

O agente de IA Bub da OpenClaw tem dificuldade com delegação, gasta US$ 20 em 15 minutos durante a otimização do site móvel.
Durante os testes de QA do Driftwatch V3, o bot OpenClaw Bub queimou US$ 20 em 15 minutos por não delegar tarefas adequadamente. O desenvolvedor descobriu que templates de especificação detalhados reduzem custos, enquanto a adaptação para mobile adicionou tempo e despesas inesperados.

Assistente de Pesquisa Multi-Agente Local Economiza 15-25 Minutos por Tarefa
Um administrador de TI construiu um pipeline de pesquisa multiagente local usando modelos Ollama que gera resumos estruturados em ~2 minutos, em vez dos 20-30 minutos de pesquisa manual. O sistema roda em RTX 5090 com 64GB de RAM e se integra ao OpenClaw para gerenciamento de agentes.

Analista Financeiro Usa Claude Code para Construir Modelo DCF Sem Experiência em Programação
Um analista financeiro sem experiência em terminal usou o Claude Code para construir um modelo de fluxo de caixa descontado em 20-25 minutos em vez de 1-2 dias. A ferramenta leu arquivos financeiros e gerou um modelo Excel totalmente estruturado com fórmulas funcionais depois que o usuário digitou /dcf [nome da empresa].

Usando Claude Code para Operações de Go-to-Market: Padrões de Engenharia de Contexto
Um desenvolvedor compartilha padrões práticos para usar o Claude Code além da programação, especificamente para executar operações de go-to-market, incluindo scraping, enriquecimento, bancos de dados, infraestrutura de e-mail e conteúdo multiplataforma. As técnicas principais incluem arquivos CLAUDE.md, delimitação de sessões, ferramentas CLI em vez de servidores MCP e subagentes para tarefas pesadas.