Warum Codex für komplexe Python-Monolithen immer noch besser ist als Claude Code

Im letzten Jahr hat ein Entwickler, der an einem komplexen Python-Monolithen arbeitet, hauptsächlich Codex verwendet. Nach einem Monat Test von Claude Code mit Opus 4.6 und 4.7 bevorzugt er für diese Codebasis immer noch Codex. Die Anwendung ist kein einfacher CRUD-Server – sie hat eine neuere DDD-ähnliche Schicht, älteren gut strukturierten Code und fragilen Legacy-Spaghetticode. Das Team vermeidet es, alte Teile neu zu schreiben, es sei denn, es ist notwendig.
Wichtige Vorteile von Codex
- Harness-Engineering-Prinzipien: Codex folgt zuverlässig dem Harness-Engineering-Workflow ohne explizite Anweisungen. Claude tut dies nur, wenn
AGENTS.mdeine Anweisung wie „Lies exec_plan.md und befolge sie“ enthält. - Wiederverwendung vorhandener Tools und Muster: Claude erstellt häufiger neue Tools, anstatt die Codebasis nach vorhandenen zu durchsuchen. In einer Codebasis mit vielen projektspezifischen Helfern ist Wiederverwendung entscheidend.
- Bessere Planung und Kontextbewusstsein: Claude liest oft zu wenig, bevor er neue Funktionalitäten platziert. Der Entwickler musste wiederholt korrigieren:
„Setze diese Funktionalität stattdessen in Modul A, nicht im Controller.“
„Konstruiere das Antwortobjekt nicht mit den Status, die du in der Anfrage gesendet hast. Die API gibt bereits das aktualisierte Objekt zurück – verwende diese Antwort.“
„Validiere es im selben Modul, dem diese Grenze gehört.“
Codex bemerkt häufiger fehlenden Kontext und stellt klärende Fragen, bevor er Architekturänderungen vornimmt.
Wo Claude glänzt
Für Frontend-Arbeiten war Opus 4.6 viel besser als Codex 5.3 und GPT-5.4. Der Entwickler bevorzugt derzeit Claude für UI-Aufgaben. Er hat GPT-5.5 noch nicht bei UI-lastigen Arbeiten getestet.
Tool-Konfiguration
Beide LLMs nutzen eine einzige gemeinsame Fähigkeit: Befehle zum Starten und Stoppen von Docker Compose und zum Ausführen von Tests innerhalb des Containers.
Dies ist kein Benchmark, sondern nur eine Erfahrung aus dem täglichen Gebrauch mit einer Produktionscodebasis.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Colony: Eine lokale Koordinationsschicht, die Multi-Agent-Handoff-Token von 30K auf 400 reduziert
Colony ist eine lokale erste Koordinationsschicht, die die Kosten für den Agentenwechsel von ~30.000 Token auf ~400 Token senkt, indem sie die Kontexterstellung durch kompakte Beobachtungen ersetzt, die in SQLite gespeichert werden.

Scalpel v2.0: Codebase-Scanner und KI-Agenten-Orchestrator
Scalpel v2.0 ist ein Open-Source-Tool, das Codebasen in 12 Dimensionen scannt und maßgeschneiderte KI-Agenten-Teams zusammenstellt. Es enthält einen reinen Bash-Scanner, der ohne KI-Tokens läuft und mit Claude Code, Codex, Gemini, Cursor, Windsurf, Aider und OpenCode funktioniert.

Open-Source Artikel-12-Protokollierungsbibliothek für die Einhaltung des EU-KI-Gesetzes
Eine kostenlose, quelloffene TypeScript-Bibliothek für Node.js-Anwendungen mit Vercel AI SDK, die die Protokollierungsanforderungen von Artikel 12 mit ausschließlich anfügbaren JSONL-Protokollen, SHA-256-Hash-Ketten zur Manipulationserkennung und Durchsetzung einer 180-tägigen Aufbewahrungsfrist implementiert.

Video Editor entwickelt kostenloses Transkriptionstool Treelo mit Claude Code
Ein Videoeditor hat Treelo erstellt, ein kostenloses Web-Tool, das Audio-/Videodateien in bearbeitbare Zeitstempelblöcke transkribiert, mit Untertitel-Voreinstellungen und Export in SRT-, VTT-, ASS- und WAV-Formaten. Das Tool wurde durch iterative Gespräche mit Claude Code entwickelt.