Otimização de Custos do OpenClaw: Como um Desenvolvedor Corrigiu um Erro de US$ 750 com Roteamento de Modelos

✍️ OpenClawRadar📅 Publicado: March 17, 2026🔗 Source
Otimização de Custos do OpenClaw: Como um Desenvolvedor Corrigiu um Erro de US$ 750 com Roteamento de Modelos
Ad

O Que Deu Errado com a Correção de Custos

Após gastar US$ 750 em 3 dias no OpenRouter, o desenvolvedor inicialmente "corrigiu" os custos trocando tudo para o Hunter Alpha (gratuito no OpenRouter). Isso fez com que os subagentes retornassem saída zero — conclusões silenciosas onde os trabalhos mostravam "sucesso", mas os resultados estavam vazios.

Um caso específico de falha: um agente de produção de vídeo escreveu código que passou na verificação de sintaxe, executou sem erros, mas produziu um vídeo preto e silencioso de 9 segundos sem narração, sem filmagem e sem manifesto. O controle de qualidade eventualmente o detectou. A lição: modelos gratuitos nem sempre falham de forma barulhenta — às vezes eles entregam silenciosamente um esboço e seguem em frente.

A Nova Estratégia de Roteamento de Modelos

O desenvolvedor parou de pensar "barato vs caro" e começou a pensar "o que esta tarefa realmente precisa":

  • Sessão principal (orquestração): Sonnet 4.6 — "O gerente. Vale o custo."
  • Código/tarefas complexas: Gemini 2.5 Flash a US$ 0,15/M — "Ponto ideal para saída real."
  • Dados sensíveis (credenciais, financeiros): Claude 3.5 Haiku — "A Anthropic não registra os prompts. Não negociável."
  • Tarefas simples previsíveis: Hunter Alpha — "Aceitável quando a falha é óbvia e os riscos são baixos."

Todos os trabalhos cron e subagentes agora têm um parâmetro de modelo explícito — sem padrões.

Ad

Descoberta de Segurança Durante a Auditoria

Enquanto investigava os problemas do modelo, o desenvolvedor encontrou credenciais comprometidas em seu repositório de workspace — chaves de API e tokens OAuth. Embora não tenham sido enviados publicamente, isso era inaceitável. Eles adicionaram um .gitignore para credentials/ e executaram git rm --cached. O aviso: se você já comprometeu uma pasta de credenciais, essas chaves permanecem no seu histórico do git — faça a rotação delas.

A Lição Principal

Otimização de custos não é uma mudança de configuração única. Um modelo de US$ 0,15/M escrevendo seu pipeline de produção é dinheiro bem gasto. Um modelo gratuito que silenciosamente entrega um vídeo quebrado é caro, não importa o custo por token. Dimensione corretamente para o trabalho e verifique a saída, não apenas os códigos de saída.

📖 Read the full source: r/openclaw

Ad

👀 See Also

O agente de IA Bub da OpenClaw tem dificuldade com delegação, gasta US$ 20 em 15 minutos durante a otimização do site móvel.
Use Cases

O agente de IA Bub da OpenClaw tem dificuldade com delegação, gasta US$ 20 em 15 minutos durante a otimização do site móvel.

Durante os testes de QA do Driftwatch V3, o bot OpenClaw Bub queimou US$ 20 em 15 minutos por não delegar tarefas adequadamente. O desenvolvedor descobriu que templates de especificação detalhados reduzem custos, enquanto a adaptação para mobile adicionou tempo e despesas inesperados.

OpenClawRadar
Assistente de Pesquisa Multi-Agente Local Economiza 15-25 Minutos por Tarefa
Use Cases

Assistente de Pesquisa Multi-Agente Local Economiza 15-25 Minutos por Tarefa

Um administrador de TI construiu um pipeline de pesquisa multiagente local usando modelos Ollama que gera resumos estruturados em ~2 minutos, em vez dos 20-30 minutos de pesquisa manual. O sistema roda em RTX 5090 com 64GB de RAM e se integra ao OpenClaw para gerenciamento de agentes.

OpenClawRadar
Analista Financeiro Usa Claude Code para Construir Modelo DCF Sem Experiência em Programação
Use Cases

Analista Financeiro Usa Claude Code para Construir Modelo DCF Sem Experiência em Programação

Um analista financeiro sem experiência em terminal usou o Claude Code para construir um modelo de fluxo de caixa descontado em 20-25 minutos em vez de 1-2 dias. A ferramenta leu arquivos financeiros e gerou um modelo Excel totalmente estruturado com fórmulas funcionais depois que o usuário digitou /dcf [nome da empresa].

OpenClawRadar
Usando Claude Code para Operações de Go-to-Market: Padrões de Engenharia de Contexto
Use Cases

Usando Claude Code para Operações de Go-to-Market: Padrões de Engenharia de Contexto

Um desenvolvedor compartilha padrões práticos para usar o Claude Code além da programação, especificamente para executar operações de go-to-market, incluindo scraping, enriquecimento, bancos de dados, infraestrutura de e-mail e conteúdo multiplataforma. As técnicas principais incluem arquivos CLAUDE.md, delimitação de sessões, ferramentas CLI em vez de servidores MCP e subagentes para tarefas pesadas.

OpenClawRadar