Claude Code vs Codex : 36 fichiers, erreurs, coûts comparés

Quelqu'un sur r/ClaudeAI a comparé en direct Claude Code et Codex (via Cursor) sur deux tâches pratiques — mêmes prompts, même configuration MCP (GitHub + Slack), même machine. Pas de benchmarks, de vrais projets.

Tâches

Tâche 1 : Robot de tri des PR — Lire les PR ouvertes, les noter par complexité (fichiers ×2, lignes/10, +3 si pas d'étiquettes, +5 si pas de relecteurs), rédiger un rapport Markdown, envoyer des alertes Slack pour les scores élevés. Nécessitait des tentatives, une journalisation des erreurs, du TypeScript strict, pas de any.
Tâche 2 : Interface de révision de code en temps réel — React + TypeScript, WebSockets, fils de commentaires en ligne, mises à jour optimistes avec annulation, visualiseur de différences virtualisé, reconnexion WebSocket avec backoff exponentiel. Pas de bibliothèques d'interface.

Résultats de Claude Code

A exécuté /mcp pour vérifier les outils avant d'écrire du code
A construit 36 fichiers en ~12 minutes
A écrit sans qu'on le demande un test de fumée WebSocket à deux clients (diffusion : 3ms)
Zéro any, vérification de types réussie du premier coup
L'interface a fonctionné immédiatement

Résultats de Codex (via Cursor)

Échec de la tâche 1 : GitHub MCP n'était pas accessible via le chemin d'exécution de Cursor. Il l'a géré proprement (3 tentatives, erreurs journalisées, pas de plantage), mais pas de livraison.
Tâche 2 : a livré une interface fonctionnelle en ~15 minutes, test de fumée réussi à 5ms
A rencontré des erreurs TypeScript à la première compilation et une boucle React infinie (useEffect appelant hydrate à répétition). A nécessité un correctif de ref guard.
28 fichiers, architecture plus compacte

Coût (estimé, les deux tâches)

Claude : ~2,50 $
Codex : ~2,04 $
Écart : ~18-23 %

Enseignements

Aucun agent n'a « gagné ». Claude donne l'impression de travailler avec quelqu'un qui vérifie tout avant de toucher le clavier. Codex donne l'impression d'un développeur senior qui veut livrer et passer à autre chose. Les deux ont obtenu une diffusion WebSocket sous 10 ms — il y a six mois, ce n'était pas garanti. Pas de fuite de any, pas de noms d'outils inventés.

📖 Lire la source complète : r/ClaudeAI

Claude Code vs Codex : 36 vs 28 fichiers, 2,50 $ vs 2,04 $, boucle infinie détectée — comparaison réelle

Tâches

Résultats de Claude Code

Résultats de Codex (via Cursor)

Coût (estimé, les deux tâches)

Enseignements

👀 See Also

Compétence de test SwiftUI open-source pour Claude Code utilisant l'utilisation informatique pour tester visuellement les applications

Ghostbar : un client IA Swift natif macOS d'environ 5 Mo qui se cache du partage d'écran

L'outil de lecture de Claude Code réduit silencieusement la qualité des images, provoquant des hallucinations

Holaboss vise à résoudre le déploiement d'agents locaux portables.