Claude Code vs Codex: 36 vs 28 archivos, $2.50 vs $2.04, bucle infinito detectado — comparación en el mundo real
Alguien en r/ClaudeAI hizo una comparación directa entre Claude Code y Codex (vía Cursor) en dos tareas prácticas—mismos prompts, misma configuración MCP (GitHub + Slack), mismo equipo. Sin benchmarks, construcciones reales.
Tareas
- Tarea 1: Bot de triaje de PR — Leer PRs abiertos, puntuar por complejidad (archivos ×2, líneas/10, +3 sin etiquetas, +5 sin revisores), escribir un informe en markdown, enviar alertas a Slack para puntuaciones altas. Requería reintentos, registro de errores, TypeScript estricto, sin
any. - Tarea 2: UI de revisión de código en tiempo real — React + TypeScript, WebSockets, hilos de comentarios en línea, actualizaciones optimistas con reversión, visor de diferencias virtualizado, reconexión WebSocket con retroceso exponencial. Sin librerías de UI.
Resultados de Claude Code
- Ejecutó
/mcppara verificar herramientas antes de escribir código - Construyó 36 archivos en ~12 minutos
- Escribió sin que se le pidiera una prueba de humo WebSocket de dos clientes (broadcast: 3ms)
- Cero
any, pasó la comprobación de tipos al primer intento - La UI funcionó de inmediato
Resultados de Codex (vía Cursor)
- Falló en la Tarea 1: El MCP de GitHub no era accesible desde la ruta de ejecución de Cursor. Lo manejó limpiamente (reintentó 3 veces, registró errores, no se colgó), pero no hubo entrega.
- Tarea 2: Entregó una UI funcional en ~15 minutos, prueba de humo pasó en 5ms
- Tuvo errores de TypeScript en la primera compilación y un bucle infinito en React (
useEffectllamando a hydrate repetidamente). Necesitó un parche de guardia con ref. - 28 archivos, arquitectura más compacta
Costo (estimado, ambas tareas)
- Claude: ~$2.50
- Codex: ~$2.04
- Diferencia: ~18-23%
Conclusiones
Ningún agente "ganó". Claude se siente como trabajar con alguien que verifica todo antes de tocar el teclado. Codex se siente como un desarrollador senior que quiere enviar y seguir adelante. Ambos consiguieron broadcast WebSocket por debajo de 10ms—hace seis meses eso no era algo garantizado. Sin fugas de any, sin nombres de herramientas alucinados.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

Mesa Redonda de IA: Herramienta para Comparar Más de 200 Modelos de IA en Preguntas Estructuradas
AI Roundtable es una herramienta gratuita que permite a los usuarios plantear preguntas con opciones de respuesta definidas, seleccionar hasta 50 modelos de un grupo de más de 200, y obtener respuestas estructuradas en condiciones idénticas. También incluye una función de debate donde los modelos pueden ver el razonamiento de los demás y un modelo revisor que resume las transcripciones.

50 aplicaciones populares reconstruidas en especificaciones de diseño legibles por Claude: Patrones clave para clonar interfaces de usuario
u/meliwat realizó ingeniería inversa de 50 aplicaciones populares para convertirlas en especificaciones de diseño estructuradas en markdown. Claude logra clones de UI con valores exactos, cobertura de estados, escalas de espaciado y gráficos de navegación. La prosa extensa degrada la salida.

¿Puede OpenClaw abrazar el poder de Claude CLI?
Explora las ideas clave de r/openclaw sobre si OpenClaw puede integrarse con Claude CLI, una poderosa herramienta de IA diseñada para mejorar los procesos de codificación y automatización.

Sherlock: Documentación de Apple Developer como MCP Local para Claude Code
Sherlock indexa 70.000 símbolos de la API de Apple en SQLite FTS5 y proporciona 5 herramientas MCP + 3 habilidades de activación automática para basar a Claude Code en documentación real, evitando alucinaciones.