Desenvolvedor compartilha desafio de custo de token com sistema ERP construído com Claude

✍️ OpenClawRadar📅 Publicado: March 20, 2026🔗 Source
Desenvolvedor compartilha desafio de custo de token com sistema ERP construído com Claude
Ad

O problema: Arquitetura de arquivo único não escala com assistentes de IA

Um desenvolvedor que administra uma pequena empresa de transporte de carga construiu um sistema ERP completo usando o Claude. O sistema cresceu para mais de 3.000 linhas de código em um único arquivo HTML contendo todos os módulos: painel de controle, rastreamento de remessas, fluxo de caixa, registros de motoristas e registros de clientes.

O problema central: Toda vez que precisam fazer até mesmo uma pequena alteração, precisam carregar todo o arquivo de mais de 3.000 linhas na janela de contexto do Claude. Isso consome aproximadamente 60.000 a 80.000 tokens por mensagem. Para um operador solo, isso cria problemas tanto de despesa quanto de ineficiência.

A causa raiz é arquitetônica: um monolito de arquivo único força o Claude a reler e reentender todas as 3.000 linhas de HTML, CSS e JavaScript misturados cada vez, mesmo quando apenas ajustando uma pequena função.

Ad

Soluções potenciais em consideração

O desenvolvedor está avaliando duas abordagens:

  • Dividir o arquivo em módulos — Separar arquivos JavaScript por recurso para que apenas o código necessário seja carregado por sessão
  • Migrar para o Firebase — Isso já estava em seu roteiro e naturalmente imporia uma arquitetura modular

Eles estão pedindo conselhos à comunidade sobre como gerenciar grandes bases de código com o Claude ou outros LLMs, especificamente como estruturar projetos para manter os custos de tokens razoáveis.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

Agentes de Código Claude Negociam Contratos de API Sem Framework de Orquestração
Use Cases

Agentes de Código Claude Negociam Contratos de API Sem Framework de Orquestração

Dois agentes Claude Code negociaram contratos de API ponto a ponto usando apenas duas ferramentas de mensagens e prompts de sistema, concordando sobre formatos de endpoints, formatos de resposta e cabeçalhos CORS antes de escrever código. A implementação da ponte tem aproximadamente 190 linhas de TypeScript com broker WebSocket e canais MCP.

OpenClawRadar
Configuração local de LLM no Mac Studio: GLM 5.1, Kimi K2.6 e o que está funcionando para codificação com Claude Code
Use Cases

Configuração local de LLM no Mac Studio: GLM 5.1, Kimi K2.6 e o que está funcionando para codificação com Claude Code

Um desenvolvedor compartilha sua configuração do Mac Studio (M3 Ultra) de maio de 2026 com GLM 5.1 quantizado (380GB, 17 tps decode), Kimi K2.6 (460GB, 21 tps decode), e observações sobre Minimax 2.7, Gemma 4 31B, Qwen 3.5 9B, e suporte pendente para Deepseek/Mimo.

OpenClawRadar
Vídeos de Tutorial de Produto Totalmente Automatizados: Claude + Playwright + Magic Hour + Remotion
Use Cases

Vídeos de Tutorial de Produto Totalmente Automatizados: Claude + Playwright + Magic Hour + Remotion

Um desenvolvedor construiu um pipeline sem intervenção humana que transforma uma URL de funcionalidade em um vídeo tutorial completo usando Claude para script/orquestração, Playwright para gravação de tela, API Magic Hour para troca de rosto/sincronização labial e Remotion para edição.

OpenClawRadar
Usar um modelo menor como camada de higiene de tempo de execução melhora a confiabilidade do agente OpenClaw
Use Cases

Usar um modelo menor como camada de higiene de tempo de execução melhora a confiabilidade do agente OpenClaw

Um desenvolvedor descobriu que adicionar um segundo modelo menor para atuar como uma camada de higiene em tempo de execução para um agente Qwen 3.5 27B no OpenClaw melhorou significativamente a confiabilidade, passando de necessitar de redefinições de sessão a cada 20-30 minutos para operação sustentada em sessão única.

OpenClawRadar