なぜ大規模なPythonモノリスにおいてCodexが依然としてClaude Codeに勝るのか

✍️ OpenClawRadar📅 公開日: April 29, 2026🔗 Source
なぜ大規模なPythonモノリスにおいてCodexが依然としてClaude Codeに勝るのか
Ad

過去1年間、複雑なPythonモノリスに取り組む開発者は主にCodexを使用してきた。Opus 4.6と4.7を搭載したClaude Codeを1ヶ月テストした後も、このコードベースではCodexを好んでいる。このアプリケーションは単純なCRUDサーバーではなく、新しいDDD風のレイヤー、古くても構造化されたコード、そして脆弱なレガシースパゲッティコードが混在している。チームは、必要がない限り古い部分の書き換えを避けている。

Codexの主な利点

  • ハーネスエンジニアリングの原則: Codexは、明示的な指示がなくても ハーネスエンジニアリングのワークフロー を確実に遵守する。Claudeは、AGENTS.md に「exec_plan.mdを読んで従え」といった指示が含まれている場合のみそうする。
  • 既存のツールとパターンを再利用: Claudeは、コードベースで既存のものを検索する代わりに、新しいツールを作成することが多い。プロジェクト固有のヘルパーが多いコードベースでは、再利用が重要である。
  • 優れた計画性とコンテキスト認識: Claudeは、新しい機能を配置する前に読む量が少なすぎることがよくある。開発者は何度も次のように修正しなければならなかった。
「この機能はコントローラーではなく、モジュールAに配置してください。」
「リクエストで送信したステータスを使ってレスポンスオブジェクトを構築しないでください。APIは既に更新されたオブジェクトを返しています。そのレスポンスを使用してください。」
「この境界を所有する同じモジュールで検証してください。」

Codexは、アーキテクチャの変更を行う前に、欠落しているコンテキストに気づき、質問を明確にすることがより頻繁にある。

Claudeが優れている点

フロントエンド作業では、Opus 4.6はCodex 5.3やGPT-5.4よりも はるかに優れていた。現在、開発者はUIタスクではClaudeを好んでいる。GPT-5.5はUI中心の作業ではまだテストしていない。

ツール設定

両方のLLMは、Docker Composeの起動と停止、およびコンテナ内でテストを実行するためのコマンドという、1つの共有スキルを使用している。


これはベンチマークではなく、1つの本番コードベースでの日常的な使用経験です。

📖 全文を読む: HN AI Agents

Ad

👀 See Also

オープンソースのMCPサーバーにより、AIエージェントがLightning Network経由でL402支払いを処理できるようになります
Tools

オープンソースのMCPサーバーにより、AIエージェントがLightning Network経由でL402支払いを処理できるようになります

FastMCPで構築されたPython MCPプラグインは、HTTP 402 Payment Requiredレスポンスを傍受し、Lightning Networkインボイスを支払い、AIエージェントのデータを取得します。リポジトリには、実際の資金を使わずにテストできるローカルダミーエージェントが含まれています。

OpenClawRadar
Attesor: Linux VM向けRosetta 2のAI駆動リバースエンジニアリング
Tools

Attesor: Linux VM向けRosetta 2のAI駆動リバースエンジニアリング

Attesorは、AppleのRosetta 2バイナリ翻訳技術をリバースエンジニアリングするGitHubプロジェクトで、そのアーキテクチャを文書化し、Linux仮想マシン上でのx86_64からARM64への翻訳を可能にすることを目指しています。

OpenClawRadar
カーパシーの自律研究プロジェクト:AIエージェントが夜通しLLM学習実験を実行
Tools

カーパシーの自律研究プロジェクト:AIエージェントが夜通しLLM学習実験を実行

アンドレイ・カーパシーは、AIエージェントがtrain.pyを編集し、5分間のナノチャット学習実験を実行し、val_bpbが改善したかどうかを確認し、一晩中単一のGPUで繰り返す最小限の自動研究プロジェクトを公開しました。

OpenClawRadar
Claude 4.6 Opusの推論機能が、MLX量子化によりApple Silicon向けに14GBに蒸留されました。
Tools

Claude 4.6 Opusの推論機能が、MLX量子化によりApple Silicon向けに14GBに蒸留されました。

開発者が、Claude 4.6 Opusの推論能力をApple Siliconハードウェアに持ち込むローカルAIモデルを量子化することに成功し、パフォーマンスを維持しながらメモリ使用量を大幅に削減しました。

OpenClawRadar