Claude Code vs Codex: 36ファイル対28ファイル、無限ループの実テスト

ある開発者が、同一のプロンプトと同一のMCP設定（GitHub + Slack）を使用して、Claude CodeとCodex（Cursor経由）を直接比較した。ヒントも追加の助けもなし。2つのタスク：

タスク1： PRトリアージボット – オープンPRを読み、複雑さをスコアリングし、レポートを作成し、高優先度のものをSlackに通知。リトライロジック、エラーログ、厳格なTypeScript（anyなし）が必要。
タスク2： リアルタイムコードレビューUI – React、WebSocket、インラインコメント、ロールバック付き楽観的更新、仮想化差分ビューア、バックオフ付き再接続。UIライブラリなし、すべてスクラッチから。

結果

Claude Code： コードを書く前にMCPツールが有効であることを確認。12分で36ファイルを構築。要求されていない2クライアントWebSocketスモークテストを含む。ブロードキャストレイテンシ：3ms。anyゼロ。タイプチェックを初回でパス。
Codex（Cursor）： タスク1でGitHub MCPにアクセスできず（Cursorの実行パスがツール記述子を公開しなかった）。3回のリトライ後tool not foundとなったが、クリーンにログ処理 – 環境の問題で、モデルの品質ではない。タスク2では約15分で動作するUIを出荷、5msのレイテンシ。初回コンパイルでTypeScriptエラーと、useEffectがhydrateを繰り返し呼び出す無限Reactループが発生し、refガードパッチが必要だった。

コスト

両タスクのAPIコスト：Claude約2.50ドル、Codex約2.04ドル。Claudeは約23％高価だったが、より詳細なアーキテクチャと初回実行でクリーンなUIを提供した。

主なポイント

著者は、2つのツールが実際には同じユースケースで競合していないと指摘する。Claude Codeは最初にドキュメントを読むペアと組むような感じであり、Codexは迅速に出荷したいシニア開発者のような感じである。どちらもanyを漏らさず、ツール名を幻覚せず、両方ともWebSocketブロードキャストを10ms未満で達成した – これは6か月前に比べて明らかな改善である。

📖 全文ソースをお読みください： r/LocalLLaMA

Claude Code対Codex：実世界でのビルドテスト – 36ファイル対28ファイル、無限ループ、0.46ドルのコスト差

結果

コスト

主なポイント

👀 See Also

ClawRelay：自動フェイルオーバー機能を備えたmacOSネイティブのOpenAI互換LLMプロキシ

Claude Academy: Claude Desktop内で動作する無料コーディングブートキャンプ

Claude Codeのフックは、複数のセッション間でのChromeタブの干渉を防止します。

OpenClawとLLMの実践的活用に関する洞察：課題と限界