Claude Code vs Codex: 36 archivos vs 28, $0.46 de diferencia

Un desarrollador realizó una comparación directa entre Claude Code y Codex (a través de Cursor) usando las mismas indicaciones y la misma configuración MCP (GitHub + Slack). Sin pistas, sin ayuda extra. Dos tareas:

Tarea 1: Bot de clasificación de PR – leer PRs abiertos, puntuar complejidad, redactar informe, notificar en Slack para alta prioridad. Requería lógica de reintento, registro de errores, TypeScript estricto (sin any).
Tarea 2: Interfaz de revisión de código en tiempo real – React, WebSocket, comentarios en línea, actualizaciones optimistas con reversión, visor de diferencias virtualizado, reconexión con retroceso. Sin bibliotecas de interfaz, todo desde cero.

Resultados

Claude Code: Verificó que las herramientas MCP estuvieran activas antes de escribir código. Construyó 36 archivos en 12 minutos. Incluyó una prueba de humo WebSocket de dos clientes que no se pidió. Latencia de transmisión: 3ms. Cero any. Pasó la verificación de tipos al primer intento.
Codex (Cursor): No pudo acceder a GitHub MCP en la Tarea 1 (la ruta de ejecución de Cursor no exponía los descriptores de herramientas). Obtuvo tool not found tras 3 reintentos, pero lo registró y manejó limpiamente – problema de entorno, no de calidad del modelo. La Tarea 2 produjo una interfaz funcional en ~15 min, latencia de 5ms. La primera compilación tuvo errores de TypeScript y un bucle infinito de React (useEffect llamando a hydrate repetidamente) que necesitó un parche de guarda de referencia.

Costo

Costo de API en ambas tareas: Claude ~$2.50, Codex ~$2.04. Claude fue ~23% más caro pero ofreció una arquitectura más granular y una interfaz limpia desde el primer intento.

Conclusiones Clave

El autor señala que las dos herramientas no compiten realmente para el mismo caso de uso. Claude Code se siente como trabajar con alguien que lee la documentación primero; Codex se siente como un desarrollador sénior que quiere lanzar rápido. Ninguno filtró any, ninguno alucinó un nombre de herramienta, y ambos lograron transmisión WebSocket por debajo de 10ms – una mejora clara respecto a hace seis meses.

📖 Lea la fuente completa: r/LocalLLaMA

Claude Code vs. Codex: Prueba de construcción en el mundo real – 36 archivos vs. 28, bucle infinito y diferencia de costo de $0.46

Resultados

Costo

Conclusiones Clave

👀 Ver también

Claude Code Karma: Panel de Observabilidad Local para Sesiones de Claude Code

Mnemos: un servidor MCP para memoria persistente de Claude Code

Herramienta de Voz a Texto sin Conexión para macOS Usando Whisper Local mediante MLX

OpenLobster: Agente de IA Autohospedado en Go con Huella de Memoria de 30MB