A Gestão de Contexto do OpenClaw é Criticada por ser Consumidora de Tokens e com Falhas Arquitetônicas

✍️ OpenClawRadar📅 Publicado: March 13, 2026🔗 Source
A Gestão de Contexto do OpenClaw é Criticada por ser Consumidora de Tokens e com Falhas Arquitetônicas
Ad

Um usuário do Reddit postou uma crítica detalhada à arquitetura do OpenClaw, visando especificamente sua abordagem de gerenciamento de contexto. A postagem argumenta que o framework lida com o estado de forma ineficiente, tratando a janela de contexto do LLM como um "aterro sanitário" por meio de despejos de contexto preguiçosos e do tipo tudo-ou-nada.

Como o OpenClaw Lida com o Contexto

De acordo com a fonte, o OpenClaw carece de um gerenciamento de estado adequado e de isolamento de estado efêmero. Cada vez que o agente dá um passo, a nova ação é cegamente anexada ao histórico global. Em três turnos, o prompt fica inchado com:

  • O prompt do sistema global
  • O arquivo completo de memória de longo prazo do usuário
  • Uma lista de todas as ferramentas disponíveis
  • A saída bruta do último comando
  • Todas as ações anteriores

O Problema com Modelos Menores

A postagem descreve o que acontece ao executar o OpenClaw em modelos mais rápidos e baratos, como as variantes Flash ou Mini:

  • Modelos menores sofrem da síndrome "perdido no meio" quando se afogam em 50k+ tokens de saídas antigas do terminal, logs de ferramentas e prompts de persona global
  • Esses modelos literalmente esquecem o objetivo original
  • Eles ou alucinam que a tarefa já está concluída
  • Ou ficam presos em um loop infinito chamando exatamente a mesma ferramenta com exatamente os mesmos argumentos
Ad

A Dependência do Claude Opus

A crítica se estende à dependência do OpenClaw de modelos de fronteira:

  • O OpenClaw afirma que seus agentes são "altamente capazes", mas essa capacidade vem de depender de modelos de fronteira massivos, como o Claude Opus
  • O Claude Opus consegue olhar para um "incêndio de lixeira" de 80.000 tokens e ignorar com sucesso 79.500 tokens de lixo histórico inútil para deduzir o próximo passo
  • Isso cria a ilusão de que o framework é bem construído, quando na realidade, o Opus está mascarando incompetência arquitetônica
  • Os usuários acabam pagando preços de API de nível Opus para ter um LLM de última geração atuando como um "filtro de lixo glorificado" para um contexto mal projetado

Recomendações Arquitetônicas

A postagem defende uma melhor engenharia em vez de força bruta:

  • Uma tarefa simples de navegador ou terminal em várias etapas não deveria exigir um modelo de trilhões de parâmetros
  • Se projetado corretamente, o loop deveria forçar o modelo a observar o ambiente e alimentá-lo exatamente com o que ele precisa ver agora e absolutamente nada mais
  • Essa abordagem poderia alcançar a mesma taxa de sucesso usando uma fração do poder computacional em modelos mais baratos e rápidos

📖 Read the full source: r/openclaw

Ad

👀 See Also

Portão de Atenção: O Desafio do Esquecimento Seletivo em Sistemas de Memória de IA
News

Portão de Atenção: O Desafio do Esquecimento Seletivo em Sistemas de Memória de IA

Um desenvolvedor que está construindo um sistema de memória de cinco camadas para um bot OpenClaw identifica uma limitação fundamental: as abordagens atuais focam na recuperação, mas carecem de mecanismos para suprimir informações irrelevantes durante tarefas focadas, similar ao filtro atencional humano.

OpenClawRadar
SubQ: Primeiro LLM Totalmente Subquadrático com Contexto de 12M Tokens e 95% de Precisão no RULER
News

SubQ: Primeiro LLM Totalmente Subquadrático com Contexto de 12M Tokens e 95% de Precisão no RULER

Subquadratic lança SubQ 1M-Preview, um LLM subquadrático com escalonamento linear de computação, contexto de 12M de tokens, atenção esparsa 52× mais rápida que FlashAttention e 95% no RULER 128K. Disponível via API, agente de código CLI (SubQ Code) e ferramenta de busca (SubQ Search).

OpenClawRadar
Comparação de Desempenho entre Qwen3-30B-A3B e Qwen3.5-35B-A3B no RTX 5090
News

Comparação de Desempenho entre Qwen3-30B-A3B e Qwen3.5-35B-A3B no RTX 5090

Um benchmark direto entre Qwen3-30B-A3B e Qwen3.5-35B-A3B em uma RTX 5090 mostra que o modelo de 30B é 35% mais rápido na geração, enquanto o modelo 3.5 lida melhor com contexto longo, apresentando escalonamento plano de tokens contra uma degradação de 21% do modelo de 30B.

OpenClawRadar
Promoção de Uso da Anthropic em Março: Como as Horas Fora de Pico Dobram os Limites do Claude
News

Promoção de Uso da Anthropic em Março: Como as Horas Fora de Pico Dobram os Limites do Claude

A Anthropic está realizando uma promoção de uso fora do horário de pico com desconto de 2x até 27 de março, onde o Claude trata o uso consumido como metade durante os horários especificados, efetivamente dobrando seu limite de 5 horas. A promoção funciona reduzindo pela metade a forma como o consumo é contabilizado, em vez de fornecer um pool de uso separado.

OpenClawRadar