Claude Code vs Codex : 36 vs 28 fichiers, 2,50 $ vs 2,04 $, boucle infinie détectée — comparaison réelle
Quelqu'un sur r/ClaudeAI a comparé en direct Claude Code et Codex (via Cursor) sur deux tâches pratiques — mêmes prompts, même configuration MCP (GitHub + Slack), même machine. Pas de benchmarks, de vrais projets.
Tâches
- Tâche 1 : Robot de tri des PR — Lire les PR ouvertes, les noter par complexité (fichiers ×2, lignes/10, +3 si pas d'étiquettes, +5 si pas de relecteurs), rédiger un rapport Markdown, envoyer des alertes Slack pour les scores élevés. Nécessitait des tentatives, une journalisation des erreurs, du TypeScript strict, pas de
any. - Tâche 2 : Interface de révision de code en temps réel — React + TypeScript, WebSockets, fils de commentaires en ligne, mises à jour optimistes avec annulation, visualiseur de différences virtualisé, reconnexion WebSocket avec backoff exponentiel. Pas de bibliothèques d'interface.
Résultats de Claude Code
- A exécuté
/mcppour vérifier les outils avant d'écrire du code - A construit 36 fichiers en ~12 minutes
- A écrit sans qu'on le demande un test de fumée WebSocket à deux clients (diffusion : 3ms)
- Zéro
any, vérification de types réussie du premier coup - L'interface a fonctionné immédiatement
Résultats de Codex (via Cursor)
- Échec de la tâche 1 : GitHub MCP n'était pas accessible via le chemin d'exécution de Cursor. Il l'a géré proprement (3 tentatives, erreurs journalisées, pas de plantage), mais pas de livraison.
- Tâche 2 : a livré une interface fonctionnelle en ~15 minutes, test de fumée réussi à 5ms
- A rencontré des erreurs TypeScript à la première compilation et une boucle React infinie (
useEffectappelant hydrate à répétition). A nécessité un correctif de ref guard. - 28 fichiers, architecture plus compacte
Coût (estimé, les deux tâches)
- Claude : ~2,50 $
- Codex : ~2,04 $
- Écart : ~18-23 %
Enseignements
Aucun agent n'a « gagné ». Claude donne l'impression de travailler avec quelqu'un qui vérifie tout avant de toucher le clavier. Codex donne l'impression d'un développeur senior qui veut livrer et passer à autre chose. Les deux ont obtenu une diffusion WebSocket sous 10 ms — il y a six mois, ce n'était pas garanti. Pas de fuite de any, pas de noms d'outils inventés.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Compétence de test SwiftUI open-source pour Claude Code utilisant l'utilisation informatique pour tester visuellement les applications
Une compétence open-source pour Claude Code appelée /ios-test teste visuellement les applications SwiftUI en utilisant la capacité d'utilisation de l'ordinateur. L'agent trouve les fichiers .xcodeproj, construit l'application dans un Simulateur, puis navigue à travers chaque écran, en appuyant sur les boutons et en suivant les liens comme un véritable utilisateur.

Ghostbar : un client IA Swift natif macOS d'environ 5 Mo qui se cache du partage d'écran
Ghostbar est un client IA natif Swift pour la barre de menus macOS (~5 Mo) qui utilise window.sharingType = .none pour devenir invisible aux enregistreurs d'écran. Fonctionne avec Ollama, vLLM, llama.cpp et tout backend compatible OpenAI.

L'outil de lecture de Claude Code réduit silencieusement la qualité des images, provoquant des hallucinations
L'outil `read` de Claude Code réduit silencieusement la résolution des images avant que le modèle ne les voie, ce qui entraîne une dégradation des résultats et des hallucinations non reconnues lors de l'extraction de texte à partir de captures d'écran.

Holaboss vise à résoudre le déploiement d'agents locaux portables.
Holaboss est un projet open-source qui traite l'agent IA comme un artefact portable avec un espace de travail par agent, des compétences/applications locales, une mémoire persistante et un runtime qui peut être empaqueté séparément de l'application de bureau. Il prend en charge des piles de modèles locales comme Ollama et nécessite Node.js 22+ sur les machines cibles.