Claude Code vs. Codex: Teste de Construção no Mundo Real – 36 Arquivos vs. 28, Loop Infinito e Diferença de Custo de $0,46

✍️ OpenClawRadar📅 Publicado: May 14, 2026🔗 Source
Claude Code vs. Codex: Teste de Construção no Mundo Real – 36 Arquivos vs. 28, Loop Infinito e Diferença de Custo de $0,46
Ad

Um desenvolvedor fez uma comparação direta entre Claude Code e Codex (via Cursor) usando prompts idênticos e a mesma configuração de MCP (GitHub + Slack). Sem dicas, sem ajuda extra. Duas tarefas:

  • Tarefa 1: Bot de triagem de PRs – ler PRs abertos, pontuar complexidade, escrever relatório, notificar no Slack para alta prioridade. Exigia lógica de repetição, registro de erros, TypeScript estrito (sem any).
  • Tarefa 2: Interface de revisão de código em tempo real – React, WebSocket, comentários inline, atualizações otimistas com rollback, visualizador de diff virtualizado, reconexão com backoff. Sem bibliotecas de UI, tudo do zero.

Resultados

  • Claude Code: Verificou se as ferramentas MCP estavam ativas antes de escrever código. Criou 36 arquivos em 12 minutos. Incluiu um teste de smoke com WebSocket de dois clientes que não foi solicitado. Latência de broadcast: 3ms. Zero any. Passou na verificação de tipos na primeira tentativa.
  • Codex (Cursor): Não conseguiu acessar o MCP do GitHub na Tarefa 1 (o caminho de execução do Cursor não expôs os descritores das ferramentas). Recebeu tool not found após 3 tentativas, mas registrou e tratou de forma limpa – problema de ambiente, não de qualidade do modelo. A Tarefa 2 gerou uma interface funcional em ~15 min, latência de 5ms. Na primeira compilação, houve erros de TypeScript e um loop infinito no React (useEffect chamando hydrate repetidamente) que precisou de um patch com guarda de referência.
Ad

Custo

Custo de API em ambas as tarefas: Claude ~$2,50, Codex ~$2,04. Claude foi ~23% mais caro, mas entregou uma arquitetura mais granular e uma interface limpa na primeira execução.

Principais Conclusões

O autor observa que as duas ferramentas não competem exatamente pelo mesmo caso de uso. Claude Code parece uma parceria com alguém que lê a documentação primeiro; Codex parece um desenvolvedor sênior que quer entregar rápido. Nenhum vazou any, nenhum alucinou um nome de ferramenta, e ambos obtiveram broadcast WebSocket abaixo de 10ms – uma clara melhoria em relação a seis meses atrás.

📖 Leia a fonte original: r/LocalLLaMA

Ad

👀 See Also

Atualização do Ollama Adiciona Suporte OpenClaw para o Modelo de Nuvem Kimi k2.5
Tools

Atualização do Ollama Adiciona Suporte OpenClaw para o Modelo de Nuvem Kimi k2.5

A Ollama lançou uma atualização que integra suporte OpenClaw para modelos em nuvem, incluindo acesso gratuito ao modelo Kimi k2.5 com funcionalidade de busca na web, executado em data centers da NVIDIA.

OpenClawRadar
A habilidade Claude Code combina as abordagens do DeepMind Aletheia e do Anthropic harness
Tools

A habilidade Claude Code combina as abordagens do DeepMind Aletheia e do Anthropic harness

Uma habilidade Claude Code implementa um pipeline Planejador→Gerador→Avaliador→Revisor que sintetiza o agente de pesquisa matemática Aletheia da DeepMind com a arquitetura de codificação multiagente da Anthropic, adicionando uma pré-análise cega onde o avaliador raciocina sobre abordagens corretas antes de ver o código candidato.

OpenClawRadar
dead-letter: Conversor Local de .eml para .md com CLI, Web UI e Servidor MCP
Tools

dead-letter: Conversor Local de .eml para .md com CLI, Web UI e Servidor MCP

dead-letter normaliza exportações de e-mail para Markdown com front matter YAML, personalizável. Oferece quatro modos de acesso: CLI, biblioteca Python, interface web e um servidor MCP para integração direta com Claude Desktop, Claude Code e Codex.

OpenClawRadar
Painel local monitora o uso do Claude Code com custos de tokens, chamadas de ferramentas e análises de sessão
Tools

Painel local monitora o uso do Claude Code com custos de tokens, chamadas de ferramentas e análises de sessão

Um desenvolvedor criou um painel local que lê os arquivos de sessão JSONL do Claude Code para visualizar o uso de tokens, custos estimados, detalhamento de chamadas de ferramentas e histórico de sessões. A ferramenta funciona inteiramente na sua máquina com uma API Express e um painel React.

OpenClawRadar