Revisão do Desempenho do Modelo OpenClaw: Codex 5.3 Lidera, Modelos GLM Decepcionam

✍️ OpenClawRadar📅 Publicado: April 17, 2026🔗 Source
Revisão do Desempenho do Modelo OpenClaw: Codex 5.3 Lidera, Modelos GLM Decepcionam
Ad

Ranking de Desempenho dos Modelos para OpenClaw

Um desenvolvedor testou vários modelos de IA com o OpenClaw e compartilhou observações detalhadas de desempenho. Os testes abrangeram os modelos Codex, Google, Sonnet, Gemini, DeepSeek e GLM da Z.ai, focando na experiência prática de uso em vez de benchmarks.

Modelos com Melhor Desempenho

  • Codex 5.3 - Nota 9/10. O modelo favorito do desenvolvedor, provavelmente ajustado para o OpenClaw com recursos de agente de chat aprimorados. Ele compreende bem a intenção do usuário, fornece a saída desejada consistentemente e tem interrupções e bugs mínimos.
  • Sonnet 4.6 - Nota 8/10. Segundo favorito devido à velocidade e capacidade de resolução de problemas. Oferece experiência suficiente quando o Codex 5.3 não está disponível, adequado para uso diário.
  • DeepSeek 3.2 Agent - Nota 7/10. Claramente personalizado para o OpenClaw, parece trabalhar com um agente nativo. Não é tão forte em codificação quanto Sonnet, Opus ou Codex, mas uma alternativa sólida para uso diário. As taxas de API são observadas como potencialmente altas para uma alternativa chinesa.

Modelos de Nível Médio

  • Google 3.1 Pro (Baixo e Alto) - Nota 6/10. Testado com autenticação antigravity. Interação fraca com o OpenClaw, desempenho lento, não convincente para uso constante. Só seria considerado se Sonnet e Codex não estivessem disponíveis.
Ad

Desempenhos Decepcionantes

  • GLM 4.7 - Nota 5/10. Comercializado como alternativa ao Sonnet com taxas de API baratas e cota 3-4x maior que o Codex em contas pro. No entanto, ele constantemente trava, responde tarde e produz saída de comprimento inconsistente mesmo em tarefas simples como verificar e-mails. Queimou 1 milhão de tokens em uma nova sessão apenas para verificar 5 e-mails.
  • GLM 5 - Nota 5/10. Benchmarks afirmam competir com Opus e Codex 5.3, mas a experiência no OpenClaw não corresponde. Usa 2-3x mais tokens para as mesmas tarefas, responde tarde e fornece respostas de codificação no nível do Sonnet 4.5. Precisa de otimização específica para o OpenClaw. A principal vantagem é o preço.
  • Gemini 3 Flash - Nota 4/10. Apenas adequado para tarefas muito simples, não recomendado para uso sério.

O desenvolvedor observou que escolher o modelo certo é difícil devido a diferenças óbvias na experiência, possivelmente porque o OpenClaw não está otimizado ou há problemas de qualidade do modelo. Eles expressaram decepção com os modelos GLM, apesar de quererem diversificar além do Codex, esperando correções futuras.

📖 Read the full source: r/openclaw

Ad

👀 See Also

Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code
Tools

Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code

Um desenvolvedor rastreou 'fpk' (palavrões por mil prompts) em 44.212 prompts do Claude Code ao longo de 5 meses, descobrindo que a frustração caiu 3,4× do Claude Opus 4-5 para o 4-7, e a maioria dos xingamentos tinha como alvo ferramentas ambientais, não o modelo.

OpenClawRadar
Audacity-MCP: Integração Claude IA para Edição de Áudio Local com 131 Ferramentas
Tools

Audacity-MCP: Integração Claude IA para Edição de Áudio Local com 131 Ferramentas

Audacity-MCP conecta Claude ao Audacity via interface de pipe, permitindo edição de áudio controlada por voz com 131 ferramentas, 9 pipelines automatizados e transcrição local com Whisper sem dependências de nuvem.

OpenClawRadar
DocMason: Base de Conhecimento de Agente Local para Arquivos de Escritório Complexos
Tools

DocMason: Base de Conhecimento de Agente Local para Arquivos de Escritório Complexos

DocMason é um aplicativo agente nativo de repositório que constrói bases de conhecimento locais a partir de documentos de escritório complexos como PPTX, DOCX, Excel e PDFs. Ele roda inteiramente dentro do Codex ou Claude Code, mantendo a estrutura do documento e fornecendo respostas rastreáveis com proveniência.

OpenClawRadar
O hook de pre-commit do Git impede que agentes de IA de codificação façam commits com documentação desatualizada.
Tools

O hook de pre-commit do Git impede que agentes de IA de codificação façam commits com documentação desatualizada.

Um desenvolvedor criou um hook de pré-commit do Git que bloqueia commits quando arquivos de documentação estão desatualizados, abordando especificamente problemas com agentes de codificação de IA como Claude Code, Cursor, Windsurf e Copilot. A ferramenta sai com código de erro 1 para forçar os agentes de IA a atualizarem a documentação antes de prosseguir.

OpenClawRadar