Claude Code vs Codex: 36 vs 28 archivos, $2.04 costo, bucle infinito

Alguien en r/ClaudeAI hizo una comparación directa entre Claude Code y Codex (vía Cursor) en dos tareas prácticas—mismos prompts, misma configuración MCP (GitHub + Slack), mismo equipo. Sin benchmarks, construcciones reales.

Tareas

Tarea 1: Bot de triaje de PR — Leer PRs abiertos, puntuar por complejidad (archivos ×2, líneas/10, +3 sin etiquetas, +5 sin revisores), escribir un informe en markdown, enviar alertas a Slack para puntuaciones altas. Requería reintentos, registro de errores, TypeScript estricto, sin any.
Tarea 2: UI de revisión de código en tiempo real — React + TypeScript, WebSockets, hilos de comentarios en línea, actualizaciones optimistas con reversión, visor de diferencias virtualizado, reconexión WebSocket con retroceso exponencial. Sin librerías de UI.

Resultados de Claude Code

Ejecutó /mcp para verificar herramientas antes de escribir código
Construyó 36 archivos en ~12 minutos
Escribió sin que se le pidiera una prueba de humo WebSocket de dos clientes (broadcast: 3ms)
Cero any, pasó la comprobación de tipos al primer intento
La UI funcionó de inmediato

Resultados de Codex (vía Cursor)

Falló en la Tarea 1: El MCP de GitHub no era accesible desde la ruta de ejecución de Cursor. Lo manejó limpiamente (reintentó 3 veces, registró errores, no se colgó), pero no hubo entrega.
Tarea 2: Entregó una UI funcional en ~15 minutos, prueba de humo pasó en 5ms
Tuvo errores de TypeScript en la primera compilación y un bucle infinito en React (useEffect llamando a hydrate repetidamente). Necesitó un parche de guardia con ref.
28 archivos, arquitectura más compacta

Costo (estimado, ambas tareas)

Claude: ~$2.50
Codex: ~$2.04
Diferencia: ~18-23%

Conclusiones

Ningún agente "ganó". Claude se siente como trabajar con alguien que verifica todo antes de tocar el teclado. Codex se siente como un desarrollador senior que quiere enviar y seguir adelante. Ambos consiguieron broadcast WebSocket por debajo de 10ms—hace seis meses eso no era algo garantizado. Sin fugas de any, sin nombres de herramientas alucinados.

📖 Lee la fuente completa: r/ClaudeAI