Claude Code против Codex: 36 против 28 файлов, $2.50 против $2.04, обнаружен бесконечный цикл — сравнение в реальных условиях
Кто-то на r/ClaudeAI провел прямое сравнение Claude Code и Codex (через Cursor) на двух практических задачах — одинаковые промпты, одинаковое MCP (GitHub + Slack), одинаковый компьютер. Никаких бенчмарков, реальные проекты.
Задачи
- Задача 1: Бот для триажа PR — читать открытые PR, оценивать сложность (файлы ×2, строки/10, +3 за отсутствие меток, +5 за отсутствие рецензентов), писать отчет в markdown, отправлять оповещения в Slack для высоких оценок. Требовались повторные попытки, логирование ошибок, строгий TypeScript, без
any. - Задача 2: Интерфейс ревью кода в реальном времени — React + TypeScript, WebSockets, встроенные цепочки комментариев, оптимистичные обновления с откатом, виртуализированный просмотрщик diff, переподключение WS с экспоненциальной задержкой. Без UI-библиотек.
Результаты Claude Code
- Запустил
/mcpдля проверки инструментов перед написанием кода - Создал 36 файлов примерно за 12 минут
- Написал без запроса тест WebSocket на двух клиентах (broadcast: 3ms)
- Ноль
any, прошел проверку типов с первой попытки - Интерфейс заработал сразу
Результаты Codex (через Cursor)
- Провалил Задачу 1: GitHub MCP был недоступен через путь выполнения Cursor. Обработал это аккуратно (повторил 3 раза, записал ошибки, не упал), но результат не доставлен.
- Задача 2: Сдал рабочий интерфейс за ~15 минут, smoke-тест прошел за 5ms
- Наткнулся на ошибки TypeScript при первой компиляции и бесконечный цикл React (
useEffectпостоянно вызывает hydrate). Потребовался патч с защитой ref. - 28 файлов, более компактная архитектура
Стоимость (оценка, обе задачи)
- Claude: ~$2.50
- Codex: ~$2.04
- Разница: ~18-23%
Выводы
Ни один агент не «победил». Claude похож на работу с тем, кто все проверяет, прежде чем прикоснуться к клавиатуре. Codex — как опытный разработчик, который хочет сдать и двигаться дальше. Оба получили широковещательную рассылку WebSocket менее чем за 10 мс — шесть месяцев назад это не было гарантировано. Никаких утечек any, никаких вымышленных имен инструментов.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Упрощение хостинга OpenClaw: BestClaw сохраняет SSH и удобство для пользователя.
BestClaw представляет собой простое решение для хостинга OpenClaw, сочетая легкость использования с жизненно важным доступом по SSH, как обсуждается на r/openclaw.

Курируемый список из 260+ ИИ-агентов и инструментов с акцентом на open-source и возможность самостоятельного хостинга.
Обширный репозиторий на GitHub содержит список более 260 ИИ-агентов и фреймворков, уделяя особое внимание открытым, самостоятельно размещаемым и локальным решениям, включая Ollama, OpenClaw и DeerFlow.

ETL-D MCP-сервер: Детерминированный парсинг CSV для Claude, предотвращающий финансовые галлюцинации
Разработчик создал ETL-D — сервер MCP с открытым исходным кодом для Claude Desktop, который обрабатывает CSV-файлы в трёх детерминированных слоях, чтобы предотвратить галлюцинации с десятичными точками в финансовых данных. Он использует парсеры Python для известных форматов, достигает времени отклика ~70 мс при 0 вызовах LLM для 200 параллельных запросов и задействует LLM только в качестве запасного варианта для текста с высокой энтропией.

Логира: Аудит среды выполнения eBPF для запусков AI-агентов
Logira — это инструмент командной строки для Linux, работающий только в режиме наблюдения. Он записывает события выполнения, файловые и сетевые события через eBPF во время запусков ИИ-агентов, с локальным хранилищем на каждый запуск в форматах JSONL и SQLite, а также со встроенными правилами обнаружения для доступа к учетным данным, изменений постоянства и подозрительных шаблонов.