Почему Codex всё ещё превосходит Claude Code для сложных монолитов на Python

✍️ OpenClawRadar📅 Опубликовано: 29 апреля 2026 г.🔗 Source
Почему Codex всё ещё превосходит Claude Code для сложных монолитов на Python
Ad

За последний год разработчик, работающий над сложным монолитом на Python, в основном использовал Codex. После месяца тестирования Claude Code с Opus 4.6 и 4.7 он всё равно предпочитает Codex для этой кодовой базы. Приложение — не простой CRUD-сервер; в нём есть новый слой в стиле DDD, старый хорошо структурированный код и хрупкий легаси-спагетти-код. Команда избегает переписывать старые части без необходимости.

Ключевые преимущества Codex

  • Принципы harness-инженерии: Codex надёжно следует рабочему процессу harness-инженерии без явных инструкций. Claude делает это только если в AGENTS.md содержится директива вроде «Прочитай exec_plan.md и следуй ему».
  • Повторно использует существующие инструменты и шаблоны: Claude чаще создаёт новые инструменты вместо поиска существующих в кодовой базе. В кодовой базе с множеством специфичных для проекта хелперов повторное использование критически важно.
  • Лучшее планирование и понимание контекста: Claude часто читает слишком мало перед добавлением новой функциональности. Разработчику приходилось неоднократно поправлять:
«Помести эту функциональность в модуль A, а не в контроллер.»
«Не конструируй объект ответа из статусов, которые ты отправил в запросе. API уже возвращает обновлённый объект — используй этот ответ.»
«Валидируй это в том же модуле, которому принадлежит эта граница.»

Codex чаще замечает отсутствующий контекст и задаёт уточняющие вопросы перед архитектурными изменениями.

Ad

Где Claude превосходит

Для фронтенд-работы Opus 4.6 был намного лучше, чем Codex 5.3 и GPT-5.4. Разработчик в настоящее время предпочитает Claude для задач UI. Он ещё не тестировал GPT-5.5 на задачах с большим объёмом UI.

Конфигурация инструментов

Обе LLM используют один общий навык: команды для запуска и остановки Docker Compose и запуска тестов внутри контейнера.


Это не бенчмарк, а просто опыт ежедневного использования одной продакшен-кодовой базы.

📖 Источник: HN AI Agents

Ad

👀 Смотрите также

Разработчик создает компилятор Scheme в WASM с помощью ИИ за 4 дня
Инструменты

Разработчик создает компилятор Scheme в WASM с помощью ИИ за 4 дня

Разработчик создал Puppy Scheme, компилятор Scheme, который компилирует в WebAssembly, примерно за 4 дня с помощью ИИ. Компилятор поддерживает 73% стандартов R5RS и R7RS, использует WASM GC и добился улучшения времени компиляции с 3½ минут до 11 секунд за ночь.

OpenClawRadar
Одновызовный конвейер MCP сокращает использование токенов Claude Code на 74%
Инструменты

Одновызовный конвейер MCP сокращает использование токенов Claude Code на 74%

Разработчик создал контекстный движок в виде MCP-сервера, который предоставляет Claude Code граф зависимостей кодовых баз, что изначально сократило использование токенов на 65%. Новая конвейерная обработка одним вызовом дополнительно снижает расход токенов на 74%, устраняя множественные циклы обмена данными и дедуплицируя результаты на стороне сервера.

OpenClawRadar
CostHawk запускает публичную таблицу лидеров по потреблению токенов для Claude Code, Codex и Cursor
Инструменты

CostHawk запускает публичную таблицу лидеров по потреблению токенов для Claude Code, Codex и Cursor

Лидерборд CostHawk ранжирует публичных пользователей Claude Code, OpenAI Codex и Cursor по общему потреблению токенов, отслеживая количество, модели и временные метки синхронизации, не сохраняя промпты или код.

OpenClawRadar
Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.
Инструменты

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.

Бенчмарк 4 инструментов автоматизации браузера через CLI с использованием Claude Sonnet 4.6 на 6 реальных задачах показал, что все достигли 100% точности, но openbrowser-ai использовал 36 010 токенов, в то время как другие использовали 77 123–94 130 токенов. Количество вызовов инструментов оказалось самым сильным предиктором стоимости токенов.

OpenClawRadar