Claude Code vs Codex: 36 vs 28 arquivos, $2,50 vs $2,04, loop infinito detectado — comparação no mundo real

✍️ OpenClawRadar📅 Publicado: May 13, 2026🔗 Source
Ad

Alguém no r/ClaudeAI fez uma comparação direta entre Claude Code e Codex (via Cursor) em duas tarefas práticas — mesmos prompts, mesma configuração MCP (GitHub + Slack), mesma máquina. Sem benchmarks, construções reais.

Tarefas

  • Tarefa 1: Bot de triagem de PR — Ler PRs abertos, pontuar por complexidade (arquivos ×2, linhas/10, +3 se sem labels, +5 se sem revisores), escrever relatório em markdown, enviar alertas no Slack para pontuações altas. Exigiu retentativas, registro de erros, TypeScript estrito, sem any.
  • Tarefa 2: Interface de revisão de código em tempo real — React + TypeScript, WebSockets, threads de comentários inline, atualizações otimistas com rollback, visualizador de diff virtualizado, reconexão WS com backoff exponencial. Sem bibliotecas de UI.

Resultados do Claude Code

  • Executou /mcp para verificar ferramentas antes de escrever código
  • Construiu 36 arquivos em ~12 minutos
  • Escreveu um teste de smoke WebSocket com dois clientes não solicitado (broadcast: 3ms)
  • Zero any, passou na verificação de tipos na primeira tentativa
  • UI funcionou imediatamente
Ad

Resultados do Codex (via Cursor)

  • Falhou na Tarefa 1: O MCP do GitHub não estava acessível através do caminho de execução do Cursor. Lidou com isso de forma limpa (repetiu 3 vezes, registrou erros, não travou), mas sem entrega.
  • Tarefa 2: Entregou uma UI funcional em ~15 minutos, teste de smoke passou em 5ms
  • Encontrou erros TypeScript na primeira compilação e um loop infinito no React (useEffect chamando hydrate repetidamente). Precisou de um patch de guarda de referência.
  • 28 arquivos, arquitetura mais compacta

Custo (estimado, ambas as tarefas)

  • Claude: ~$2,50
  • Codex: ~$2,04
  • Diferença: ~18-23%

Conclusões

Nenhum agente "venceu". Claude parece trabalhar com alguém que verifica tudo antes de tocar no teclado. Codex parece um dev sênior que quer entregar e seguir em frente. Ambos conseguiram broadcast WebSocket abaixo de 10ms — seis meses atrás isso não era garantido. Sem vazamentos de any, sem nomes de ferramentas alucinados.

📖 Leia a fonte original: r/ClaudeAI

Ad

👀 See Also