Roteamento do tráfego da API Claude para controlar custos após mudança na assinatura Max

✍️ OpenClawRadar📅 Publicado: April 13, 2026🔗 Source
Roteamento do tráfego da API Claude para controlar custos após mudança na assinatura Max
Ad

Migração para cobrança por API e implicações de custo

A partir do meio-dia PT, a assinatura Max da Anthropic não cobre mais o uso de ferramentas de terceiros como o OpenClaw. Todos os usuários do OpenClaw agora estão na cobrança por API com estas tarifas:

  • Claude Opus 4.6: US$ 5 por milhão de tokens de entrada, US$ 25 por milhão de tokens de saída
  • Claude Sonnet 4.6: US$ 3 por milhão de tokens de entrada, US$ 15 por milhão de tokens de saída
  • Claude Haiku 4.5: US$ 1 por milhão de tokens de entrada, US$ 5 por milhão de tokens de saída

Uma sessão intensa do OpenClaw no Opus pode custar US$ 1-4, enquanto a mesma sessão no Sonnet custa US$ 0,20-0,80 com resultados semelhantes para a maioria das tarefas.

Ad

A solução de roteamento

A maioria das operações do OpenClaw não requer o Opus: verificações de heartbeat, leituras de arquivo, resumos, decisões de roteamento e chamadas curtas de ferramentas podem ser todas tratadas pelo Sonnet. Sem uma camada de roteamento, cada solicitação atinge seu modelo padrão, potencialmente desperdiçando orçamento do Opus em tarefas simples.

Um proxy local roteia solicitações do Claude por complexidade: tarefas simples vão automaticamente para o Sonnet, as complexas escalam para o Opus. Esta abordagem reduziu significativamente os custos sem perda de qualidade em tarefas importantes.

O proxy é de código aberto e instalável via npm: npm install -g @relayplane/proxy

Documentação detalhada e discussão estão disponíveis no r/ClaudeCode, onde a solução recebeu 52 mil visualizações.

📖 Read the full source: r/openclaw

Ad

👀 See Also

Resultados de Benchmark: Quando Usar Claude Opus com Codex vs. Opus Puro para Geração de Código
Tools

Resultados de Benchmark: Quando Usar Claude Opus com Codex vs. Opus Puro para Geração de Código

Um benchmark controlado testou a abordagem 'Planejar com Opus, Executar com Codex' em três tarefas reais de programação. Os resultados mostram um ponto de equilíbrio de custo em aproximadamente 600 linhas de código, com recomendações específicas baseadas no tamanho do projeto.

OpenClawRadar
Forge: Um Sistema de Memória para Claude Code Construído com Claude Code
Tools

Forge: Um Sistema de Memória para Claude Code Construído com Claude Code

Um desenvolvedor criou o Forge, um servidor MCP de monorepo TypeScript que captura automaticamente decisões, restrições e rejeições de conversas do Claude Code. Ele usa um pipeline de seis estágios para classificar, extrair e persistir dados estruturados em um modelo SQLite com origem em eventos.

OpenClawRadar
re_gent: Git para Agentes de Codificação de IA – Controle de Versão para Atividade do Agente
Tools

re_gent: Git para Agentes de Codificação de IA – Controle de Versão para Atividade do Agente

re_gent é uma ferramenta de código aberto que fornece controle de versão para sessões de agentes de IA, rastreando cada chamada de ferramenta, armazenando prompts e diffs de arquivos, e permitindo comandos como `rgt log`, `rgt blame` e `rgt rewind` (em breve).

OpenClawRadar
Aplicativo Claude Desktop Adiciona Recurso de Projetos à Interface de Colaboração
Tools

Aplicativo Claude Desktop Adiciona Recurso de Projetos à Interface de Colaboração

O aplicativo de desktop do Claude agora inclui um recurso de Projetos no Cowork, permitindo que os usuários organizem tarefas e contexto em espaços de trabalho dedicados. Os arquivos e instruções permanecem no computador local do usuário, com opções para importar projetos existentes ou iniciar novos.

OpenClawRadar