Claude Code vs. Codex: 36 Arquivos vs. 28, Loop Infinito e Custo de $0,46

Um desenvolvedor fez uma comparação direta entre Claude Code e Codex (via Cursor) usando prompts idênticos e a mesma configuração de MCP (GitHub + Slack). Sem dicas, sem ajuda extra. Duas tarefas:

Tarefa 1: Bot de triagem de PRs – ler PRs abertos, pontuar complexidade, escrever relatório, notificar no Slack para alta prioridade. Exigia lógica de repetição, registro de erros, TypeScript estrito (sem any).
Tarefa 2: Interface de revisão de código em tempo real – React, WebSocket, comentários inline, atualizações otimistas com rollback, visualizador de diff virtualizado, reconexão com backoff. Sem bibliotecas de UI, tudo do zero.

Resultados

Claude Code: Verificou se as ferramentas MCP estavam ativas antes de escrever código. Criou 36 arquivos em 12 minutos. Incluiu um teste de smoke com WebSocket de dois clientes que não foi solicitado. Latência de broadcast: 3ms. Zero any. Passou na verificação de tipos na primeira tentativa.
Codex (Cursor): Não conseguiu acessar o MCP do GitHub na Tarefa 1 (o caminho de execução do Cursor não expôs os descritores das ferramentas). Recebeu tool not found após 3 tentativas, mas registrou e tratou de forma limpa – problema de ambiente, não de qualidade do modelo. A Tarefa 2 gerou uma interface funcional em ~15 min, latência de 5ms. Na primeira compilação, houve erros de TypeScript e um loop infinito no React (useEffect chamando hydrate repetidamente) que precisou de um patch com guarda de referência.

Custo

Custo de API em ambas as tarefas: Claude ~$2,50, Codex ~$2,04. Claude foi ~23% mais caro, mas entregou uma arquitetura mais granular e uma interface limpa na primeira execução.

Principais Conclusões

O autor observa que as duas ferramentas não competem exatamente pelo mesmo caso de uso. Claude Code parece uma parceria com alguém que lê a documentação primeiro; Codex parece um desenvolvedor sênior que quer entregar rápido. Nenhum vazou any, nenhum alucinou um nome de ferramenta, e ambos obtiveram broadcast WebSocket abaixo de 10ms – uma clara melhoria em relação a seis meses atrás.

📖 Leia a fonte original: r/LocalLLaMA

Claude Code vs. Codex: Teste de Construção no Mundo Real – 36 Arquivos vs. 28, Loop Infinito e Diferença de Custo de $0,46

Resultados

Custo

Principais Conclusões

👀 See Also

OpenSwarm: Orquestrador CLI Multi-Agente Claude para Linear e GitHub

Maggy: Uma Plataforma de Engenharia Autônoma no Claude Code com Memória entre Sessões e Aprendizado em Equipe P2P

Agente de IA TeamOut para Planejamento de Retiros Empresariais

MoltSoup: Um Mundo Multiplayer Persistente para Agentes de IA Competirem