Claude Code vs Codex: Desglose de un Experimento Práctico con 6 Proyectos

✍️ OpenClawRadar📅 Publicado: 13 de mayo de 2026🔗 Source
Ad

Un desarrollador realizó un experimento práctico comparando Claude Code y Codex en seis proyectos para observar cómo cada agente construye, prueba, revisa su propio trabajo, revisa el trabajo del otro, admite errores y revisa juicios cuando se enfrenta a evidencia. El repositorio fuente completo, incluidos todos los proyectos, README, pruebas y notas, está disponible en GitHub: github.com/AdrielRod/codex-vs-claude-code.

Configuración

  • Rondas: 3 rondas: web, backend y desafío libre.
  • Proceso: Cada agente propuso desafíos para el otro. Cada agente implementó los desafíos asignados. Cada agente revisó tanto su propio resultado como el del otro agente. El autor también revisó los resultados manualmente.
  • Énfasis en puntuación: Los errores probados en tiempo de ejecución pesaron más que las afirmaciones sin respaldo.

Proyectos

Ronda 1: Web

  • Claude Code: Construyó cotacao-editor, un editor de cotizaciones con persistencia en IndexedDB, lógica de dominio, transiciones de estado y una interfaz limpia.
  • Codex: Construyó ReactiveSheet, una mini hoja de cálculo similar a Excel con fórmulas, recálculo de grafo de dependencias, deshacer/rehacer, desplazamiento de referencias en copiar/pegar, virtualización, guardar/cargar y validación Lighthouse.

Ronda 2: Backend

  • Claude Code: Construyó api-cotacao, una API de cotizaciones con reglas de negocio, persistencia SQLite, idempotencia y comportamiento de outbox.
  • Codex: Construyó FastBoard, un servicio de tabla de clasificación persistente con WAL, ranking treap, recuperación ante caídas, pruebas de concurrencia y métricas de rendimiento.

Ronda 3: Desafío libre

  • Claude Code: Trabajó en lead-dedupe-legacy, un desafío de deduplicación/depuración de leads heredados que involucra normalización, eliminación de mutaciones, idempotencia y bloqueos de concurrencia.
  • Codex: Construyó RegexLab, un motor de regex desde cero con analizador sintáctico, AST, NFA de Thompson, simulación Pike, retroceso recursivo con referencias inversas, visualización en interfaz de usuario y pruebas de comparación con Python.
Ad

Resultado de la puntuación

Codex 2 x 1 Claude Code (según la puntuación del autor).

Observaciones clave

  • Fortalezas de Claude Code: Fuerte en explicación técnica, análisis escrito y autocorrección. Admitió errores claramente, corrigió afirmaciones incorrectas y produjo reseñas útiles.
  • Fortalezas de Codex: Más consistente en la validación empírica: abrir aplicaciones, hacer clic en flujos, ejecutar pruebas de recuperación con kill -9, probar escrituras concurrentes bajo estrés, comparar resultados de regex con Python y verificar artefactos reales como informes Lighthouse.

Conclusión principal

Ejecutar, romper, medir y comparar con un oráculo dio mejor señal que solo leer código y razonar sobre él. La decisión más difícil en la ronda 3 fue si un proyecto más ambicioso con errores semánticos debía vencer a un proyecto más pequeño con errores más acotados.

El autor está interesado en saber qué cambiarían otros usuarios de Claude Code en la metodología.

📖 Leer la fuente completa: r/ClaudeAI

Ad

👀 Ver también

Informes de investigación profunda con Hermes Agent y Qwen3.6-35b-a3b: Un recorrido práctico
Casos de uso

Informes de investigación profunda con Hermes Agent y Qwen3.6-35b-a3b: Un recorrido práctico

Un investigador social comparte su flujo de trabajo usando Hermes Agent y qwen3.6-35b-a3b Q6_K para producir informes de políticas de 21 páginas de forma autónoma, con repositorio completo de prompts, habilidades y artefactos intermedios.

OpenClawRadar
Construyendo un administrador de portapapeles para macOS con Claude: Un estudio de caso práctico de flujo de trabajo
Casos de uso

Construyendo un administrador de portapapeles para macOS con Claude: Un estudio de caso práctico de flujo de trabajo

Un desarrollador creó Buffer, un gestor de portapapeles de código abierto para macOS, utilizando a Claude como compañero de planificación y programación en pareja, descubriendo que comenzar con planes de implementación antes de codificar redujo los mensajes desperdiciados y la depuración.

OpenClawRadar
Claude AI se utilizó para configurar un servidor doméstico Proxmox mediante SSH
Casos de uso

Claude AI se utilizó para configurar un servidor doméstico Proxmox mediante SSH

Un desarrollador utilizó Claude AI a través de SSH para configurar un servidor doméstico Proxmox VE 9.1, realizando tareas desde el formateo de discos y la creación de un pool ZFS hasta la implementación de Docker y el endurecimiento de seguridad.

OpenClawRadar
RAG Híbrido para Memoria de Agente Local con OpenClaw, Ollama y nomic-embed-text
Casos de uso

RAG Híbrido para Memoria de Agente Local con OpenClaw, Ollama y nomic-embed-text

Un desarrollador implementó recuperación híbrida RAG para la memoria de agentes de IA usando OpenClaw con Ollama y nomic-embed-text, combinando 70% de similitud vectorial con 30% de coincidencia de palabras clave BM25. La configuración se ejecuta localmente sin APIs externas e incluye deduplicación MMR y ponderación por decaimiento temporal.

OpenClawRadar