Клод Код против Кодекса: разбор практического эксперимента на 6 проектах

✍️ OpenClawRadar📅 Опубликовано: 13 мая 2026 г.🔗 Source
Ad

Разработчик провёл практический эксперимент, сравнивая Claude Code и Codex на шести проектах, чтобы оценить, как каждый агент строит, тестирует, проверяет свою работу, рецензирует работу другого, признаёт ошибки и пересматривает суждения при наличии доказательств. Полный репозиторий исходного кода, включая все проекты, README, тесты и заметки, доступен на GitHub: github.com/AdrielRod/codex-vs-claude-code.

Настройка

  • Раунды: 3 раунда: веб, бэкенд и свободное задание.
  • Процесс: Каждый агент предлагал задания для другого. Каждый агент реализовывал назначенные задания. Каждый агент проверял как свой собственный результат, так и результат другого агента. Автор также вручную проверил результаты.
  • Акцент в оценке: Ошибки, подтверждённые во время выполнения, оценивались выше, чем неподтверждённые утверждения.

Проекты

Раунд 1: Веб

  • Claude Code: Разработал cotacao-editor — редактор котировок с хранением в IndexedDB, бизнес-логикой, переходами статусов и чистым интерфейсом.
  • Codex: Разработал ReactiveSheet — мини-таблицу, похожую на Excel, с формулами, пересчётом графа зависимостей, отменой/повтором, копированием/вставкой со смещением ссылок, виртуализацией, сохранением/загрузкой и проверкой Lighthouse.

Раунд 2: Бэкенд

  • Claude Code: Разработал api-cotacao — API для котировок с бизнес-правилами, хранением в SQLite, идемпотентностью и поведением исходящих сообщений.
  • Codex: Разработал FastBoard — сервис постоянной таблицы лидеров с WAL, treap-ранжированием, восстановлением после сбоев, тестами конкурентности и метриками производительности.

Раунд 3: Свободное задание

  • Claude Code: Работал над lead-dedupe-legacy — задачей по дедупликации/отладке устаревших лидов, включающей нормализацию, удаление мутаций, идемпотентность и блокировки конкурентного доступа.
  • Codex: Разработал RegexLab — движок регулярных выражений с нуля с парсером, AST, NFA Томпсона, симуляцией Пайка, рекурсивным возвратом с обратными ссылками, визуализацией UI и тестами на сравнение с Python.
Ad

Результат оценки

Codex 2 x 1 Claude Code (по оценке автора).

Ключевые наблюдения

  • Сильные стороны Claude Code: Хорошо объясняет технические детали, проводит письменный анализ и самокоррекцию. Чётко признавал ошибки, исправлял неверные утверждения и составлял полезные рецензии.
  • Сильные стороны Codex: Более последователен в эмпирической проверке: открывает приложения, проверяет рабочие процессы, запускает тесты восстановления после kill -9, тестирует конкурентную запись под нагрузкой, сравнивает вывод регулярных выражений с Python и проверяет фактические артефакты, такие как отчёты Lighthouse.

Основной вывод

Запуск, взлом, измерение и сравнение с эталоном дали лучший сигнал, чем только чтение кода и размышления о нём. Самым сложным суждением в раунде 3 было то, должен ли более амбициозный проект с семантическими ошибками превзойти меньший проект с более узкими ошибками.

Автору интересно узнать, что другие пользователи Claude Code изменили бы в методологии.

📖 Прочитать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Создание AI-ресепшиониста для автомастерской: RAG-пайплайн и интеграция голосового управления
Кейсы

Создание AI-ресепшиониста для автомастерской: RAG-пайплайн и интеграция голосового управления

Разработчик создал пользовательского ИИ-ресепшиониста по имени Axle для люксовой автомастерской, используя RAG-пайплайн с MongoDB Atlas и эмбеддингами Voyage AI, а затем подключил его к реальной телефонной линии через Vapi с использованием FastAPI и Ngrok.

OpenClawRadar
Тестирование конвейера RAG показывает, что стоимость за токен — не лучший критерий для выбора модели.
Кейсы

Тестирование конвейера RAG показывает, что стоимость за токен — не лучший критерий для выбора модели.

Разработчик протестировал Claude Haiku 4.5, Amazon Nova Pro и Amazon Nova Lite на идентичных RAG-пайплайнах с реальными запросами и обнаружил, что самая дешёвая модель на токен выдавала наименее полезные ответы, что в итоге обходилось дороже за полезный ответ.

OpenClawRadar
Открытый исходный код навыка Claude Code для координации семейной логистики
Кейсы

Открытый исходный код навыка Claude Code для координации семейной логистики

Разработчик создал Parent Helper — навык Claude Code, который координирует семейные расписания, планирование питания и оптимизацию покупок продуктов с помощью одного файла в формате markdown и интеграций MCP. Инструмент прогнозирует экономию на продуктах в размере $4,3 тыс. в год за счёт разделения списков покупок между магазинами на основе цен.

OpenClawRadar
Клод ИИ анализирует данные о поездках на автомобиле из CSV-файла без конкретных запросов.
Кейсы

Клод ИИ анализирует данные о поездках на автомобиле из CSV-файла без конкретных запросов.

Пользователь загрузил CSV-экспорт данных о поездках на автомобиле в Claude AI, который автоматически сгенерировал комплексный анализ и дашборд без дополнительных запросов, начав с разговора о метриках эффективности кВт·ч/100 миль.

OpenClawRadar