Inchaço de tokens em frameworks de agentes: uma relação de entrada-saída de 500:1 é normal

Um usuário do Reddit executando um agente de IA auto-hospedado baseado no Telegram, com roteamento de múltiplos provedores, notou proporções extremas de tokens de entrada para saída: ~21k tokens de entrada por mensagem contra 50-200 tokens de saída, resultando em proporções de 100:1 a 500:1. Detalhamento: definições de ferramentas ~13k tokens, prompt do sistema ~5k, arquivos de memória/contexto ~3k, mensagem do usuário <100 tokens.
Isso é Normal?
A resposta da comunidade confirma que 15-25k de contexto base é padrão para frameworks de agentes como LangChain e AutoGPT. A alta proporção é estrutural para ter acesso real a ferramentas. Principais recomendações:
- Modelo principal barato — os custos permanecem limitados mesmo com inchaço
- Cache de prompt — economiza em sessões ativas, mas tem um TTL de 5 minutos, limitando a eficácia em períodos ociosos
- Limites de gastos — salvaguarda essencial mesmo com modelos baratos
Estratégias de Mitigação
Os usuários debatem duas abordagens: reduzir as definições de ferramentas por mensagem com base na intenção (seleção dinâmica de ferramentas) versus aceitar o inchaço e confiar no cache. Avaliações sugerem que bifurcar o framework para reduzir a sobrecarga raramente é necessário, a menos que esteja construindo em escala. O consenso: 21k de contexto é “o custo de fazer negócios” com frameworks de agentes.
📖 Leia a fonte original: r/openclaw
👀 See Also

Dicas de Instalação do OpenClaw: Pular a Integração e Usar Comandos de Diagnóstico
Um usuário do Reddit compartilha conselhos práticos de instalação do OpenClaw: pule o processo de integração para evitar problemas comuns, especialmente em configurações VPS, e use os comandos openclaw doctor e openclaw status para diagnosticar problemas de configuração.

Os Agentes de Código Claude Não Lêem Automaticamente a Documentação do Projeto
Quando o Claude Code despacha subagentes como o Sonnet para escrever código, esses agentes veem apenas o que está explicitamente incluído em seu prompt e não leem automaticamente os arquivos CLAUDE.md, MEMORY.md ou outros arquivos de contexto do projeto, a menos que sejam especificamente instruídos a fazê-lo.

Usando Narrativas de Projeto para Manter o Contexto do OpenClaw em Projetos de Longo Prazo
Um desenvolvedor compartilha uma técnica para criar 'narrativas de projeto' onde um trabalhador separado do OpenClaw analisa a base de código após marcos importantes para documentar a compreensão do sistema, identificar problemas e manter o contexto.

OpenClaw no M4 Pro: Encontrando Barreiras com Uso de Navegador, Uso de Computador e Codex
Um usuário relata agentes presos em loops de terminal, sendo bloqueados em sites e saídas do Codex quebradas, buscando ajustes de configuração para o navegador de automação, controle de GUI do macOS e loops de interrupção.