Claude Code vs Codex: Aufschlüsselung eines praktischen Experiments mit 6 Projekten

✍️ OpenClawRadar📅 Veröffentlicht: 13. Mai 2026🔗 Source
Ad

Ein Entwickler führte ein praktisches Experiment durch, bei dem er Claude Code und Codex in sechs Projekten verglich, um zu beobachten, wie jeder Agent eigene und fremde Arbeit erstellt, testet, reviewt, Fehler eingesteht und Urteile revidiert, wenn er mit Beweisen konfrontiert wird. Das vollständige Quell-Repository mit allen Projekten, READMEs, Tests und Notizen ist auf GitHub verfügbar: github.com/AdrielRod/codex-vs-claude-code.

Aufbau

  • Runden: 3 Runden: Web, Backend und freie Challenge.
  • Prozess: Jeder Agent schlug Herausforderungen für den anderen vor. Jeder Agent implementierte die zugewiesenen Herausforderungen. Jeder Agent überprüfte sowohl seine eigene als auch die Arbeit des anderen Agenten. Der Autor überprüfte die Ergebnisse manuell.
  • Schwerpunkt der Bewertung: Laufzeitbestätigte Fehler wurden stärker gewichtet als unbelegte Behauptungen.

Projekte

Runde 1: Web

  • Claude Code: Baute cotacao-editor, einen Angebotseditor mit IndexedDB-Persistenz, Domänenlogik, Statusübergängen und einer sauberen UI.
  • Codex: Baute ReactiveSheet, ein mini-Excel-ähnliches Tabellenblatt mit Formeln, Abhängigkeitsgraph-Neuberechnung, Rückgängig/Wiederholen, Kopieren/Einfügen mit Referenzverschiebung, Virtualisierung, Speichern/Laden und Lighthouse-Validierung.

Runde 2: Backend

  • Claude Code: Baute api-cotacao, eine Angebots-API mit Geschäftsregeln, SQLite-Persistenz, Idempotenz und Outbox-Verhalten.
  • Codex: Baute FastBoard, einen persistenten Bestenlisten-Dienst mit WAL, Treap-Ranking, Crash-Recovery, Parallelitätstests und Leistungsmetriken.

Runde 3: Freie Challenge

  • Claude Code: Arbeitete an lead-dedupe-legacy, einer Legacy-Herausforderung zur Deduplizierung/Debugging von Leads mit Normalisierung, Mutationsentfernung, Idempotenz und Parallelitätssperren.
  • Codex: Baute RegexLab, eine Regex-Engine von Grund auf mit Parser, AST, Thompson-NFA, Pike-Simulation, rekursivem Backtracking mit Rückreferenzen, UI-Visualisierung und Python-Vergleichstests.
Ad

Bewertungsergebnis

Codex 2 x 1 Claude Code (laut Bewertung des Autors).

Wichtige Beobachtungen

  • Stärken von Claude Code: Stark in technischer Erklärung, schriftlicher Analyse und Selbstkorrektur. Es räumte Fehler klar ein, korrigierte falsche Behauptungen und erstellte nützliche Reviews.
  • Stärken von Codex: Konsistenter bei empirischer Validierung: Apps öffnen, durch Flows klicken, kill -9 Recovery-Tests durchführen, gleichzeitige Schreibzugriffe stresstesten, Regex-Ausgabe mit Python vergleichen und tatsächliche Artefakte wie Lighthouse-Berichte prüfen.

Wichtigste Erkenntnis

Ausführen, Kaputtmachen, Messen und Vergleichen mit einer Referenz lieferte bessere Signale als nur Code zu lesen und darüber nachzudenken. Der schwierigste Bewertungsfall in Runde 3 war, ob ein ehrgeizigeres Projekt mit semantischen Fehlern ein kleineres Projekt mit engeren Fehlern schlagen sollte.

Der Autor ist daran interessiert zu hören, was andere Claude Code-Nutzer an der Methodik ändern würden.

📖 Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Wiederherstellen gelöschter Apple Music-Playlists mit Claude Cowork
Anwendungsfälle

Wiederherstellen gelöschter Apple Music-Playlists mit Claude Cowork

Ein Nutzer stellte 75 Playlists und 8.185 Titel wieder her, nachdem er versehentlich seine gesamte Apple Music-Bibliothek gelöscht hatte. Claude Cowork analysierte die Datenexportdateien von Apple, schrieb Python-Skripte zur Auswertung, erstellte AppleScripts für die Wiederherstellung und entwickelte spezielle HTML-Tools für fehlende Titel.

OpenClawRadar
Entwickler veröffentlicht Steam-Spiel mit Claude-Code: Lehren über Vibe Coding vs. Vibe Engineering
Anwendungsfälle

Entwickler veröffentlicht Steam-Spiel mit Claude-Code: Lehren über Vibe Coding vs. Vibe Engineering

Ein Entwickler hat Codex Mortis, ein nekromantisch-thematisiertes Bullet-Hell-Spiel auf Steam veröffentlicht, das mit Claude Code für KI-unterstützte Entwicklung erstellt wurde. Das Projekt erforderte zwei komplette Überarbeitungen nach dem ersten Prototyp, was die Kluft zwischen Prototyp und Produktion verdeutlicht.

OpenClawRadar
Aufbau einer Linux-Distribution mit Claude AI: Eine praktische Schritt-für-Schritt-Anleitung für Entwickler
Anwendungsfälle

Aufbau einer Linux-Distribution mit Claude AI: Eine praktische Schritt-für-Schritt-Anleitung für Entwickler

Ein Entwickler mit 23 Jahren Erfahrung in der Technologiebranche hat NubiferOS, eine sicherheitsoptimierte Linux-Distribution, erstellt und dabei Claude AI als das gesamte Entwicklungsteam eingesetzt. Das Projekt umfasste 10-15 gleichzeitige Claude-Sitzungen, erzeugte etwa 39.300 Codezeilen und etwa 57.500 Dokumentationszeilen, ohne eine einzige vom Menschen geschriebene Codezeile.

OpenClawRadar
Neugestaltung einer Website mit Claude Code, Strapi und GCP Cloud Run
Anwendungsfälle

Neugestaltung einer Website mit Claude Code, Strapi und GCP Cloud Run

Ein Entwickler baute seine Lovable-Website mit Claude Code neu, nutzte Strapi als Headless-CMS und GCP Cloud Run für das Deployment. Das Projekt setzte auf eigene Fähigkeiten für Design, Automatisierung und Content-Pipelines, um die Einschränkungen des Lovable-Credit-Systems zu umgehen.

OpenClawRadar