Claude Code対Codex:実世界でのビルドテスト – 36ファイル対28ファイル、無限ループ、0.46ドルのコスト差

ある開発者が、同一のプロンプトと同一のMCP設定(GitHub + Slack)を使用して、Claude CodeとCodex(Cursor経由)を直接比較した。ヒントも追加の助けもなし。2つのタスク:
- タスク1: PRトリアージボット – オープンPRを読み、複雑さをスコアリングし、レポートを作成し、高優先度のものをSlackに通知。リトライロジック、エラーログ、厳格なTypeScript(
anyなし)が必要。 - タスク2: リアルタイムコードレビューUI – React、WebSocket、インラインコメント、ロールバック付き楽観的更新、仮想化差分ビューア、バックオフ付き再接続。UIライブラリなし、すべてスクラッチから。
結果
- Claude Code: コードを書く前にMCPツールが有効であることを確認。12分で36ファイルを構築。要求されていない2クライアントWebSocketスモークテストを含む。ブロードキャストレイテンシ:3ms。
anyゼロ。タイプチェックを初回でパス。 - Codex(Cursor): タスク1でGitHub MCPにアクセスできず(Cursorの実行パスがツール記述子を公開しなかった)。3回のリトライ後
tool not foundとなったが、クリーンにログ処理 – 環境の問題で、モデルの品質ではない。タスク2では約15分で動作するUIを出荷、5msのレイテンシ。初回コンパイルでTypeScriptエラーと、useEffectがhydrateを繰り返し呼び出す無限Reactループが発生し、refガードパッチが必要だった。
コスト
両タスクのAPIコスト:Claude約2.50ドル、Codex約2.04ドル。Claudeは約23%高価だったが、より詳細なアーキテクチャと初回実行でクリーンなUIを提供した。
主なポイント
著者は、2つのツールが実際には同じユースケースで競合していないと指摘する。Claude Codeは最初にドキュメントを読むペアと組むような感じであり、Codexは迅速に出荷したいシニア開発者のような感じである。どちらもanyを漏らさず、ツール名を幻覚せず、両方ともWebSocketブロードキャストを10ms未満で達成した – これは6か月前に比べて明らかな改善である。
📖 全文ソースをお読みください: r/LocalLLaMA
👀 See Also

ClawRelay:自動フェイルオーバー機能を備えたmacOSネイティブのOpenAI互換LLMプロキシ
ClawRelayは、macOS 15+上でOpenAI互換のHTTPサーバーを実行し、LLMプロバイダー間の自動フェイルオーバーを提供します。OpenAI、Groq、Nvidia NIMs、Ollama、および/v1/chat/completionsエンドポイントを持つあらゆるサービスをサポートしています。

Claude Academy: Claude Desktop内で動作する無料コーディングブートキャンプ
開発者が、Claude DesktopのCodeタブ内で完全に動作する無料のコーディングブートキャンプ「Claude Academy」を構築しました。このシステムは3つのコマンドを使用して、ウェブ開発の基礎をカバーする64の構造化されたレッスンを提供し、進捗追跡と実際のプロジェクト構築を実現しています。

Claude Codeのフックは、複数のセッション間でのChromeタブの干渉を防止します。
開発者は、各Claude Codeセッションを独自のChromeタブに固定する3つのフック(session-start、capture-tab-id、enforce-tab-id)を作成しました。これにより、テスト実行やフォーム入力中にセッションが誤って他のセッションのタブにアクセスするのを防ぎます。

OpenClawとLLMの実践的活用に関する洞察:課題と限界
OpenClawユーザーがLLMとの統合問題について説明し、Discordボットからの支離滅裂な応答を引用しています。