Тест ИИ: Claude побеждает Gemini, ChatGPT и Grok в Python

Настройка турнира Robot Word Racer

Разработчик создал соревновательное задание по программированию под названием "Robot Word Racer", чтобы протестировать четырех ИИ-помощников: Claude, Gemini, ChatGPT и Grok. Каждый ИИ получил одинаковое задание и должен был написать полного клиента на Python 3.10, используя только стандартную библиотеку.

Механика испытания

Турнир включал следующие ограничения:

Четыре ИИ-бота одновременно подключаются к TCP-серверу
Каждый бот получает сетку букв размером 15×15
Боты соревнуются в поиске и отправке допустимых слов быстрее друг друга
Слова должны составляться из соседних клеток на сетке (по горизонтали, вертикали или диагонали)
Каждая клетка не может использоваться повторно в одном слове
Минимальная длина слова — три буквы
Формула подсчета очков: буквы − 6 (короткие слова отнимают очки, длинные — приносят)
Отправка слова, которого нет в словаре или которое нельзя составить на сетке, приводит к немедленной дисквалификации
Каждый раунд длится десять секунд

Результаты

Согласно источнику, Claude одержал решительную победу в турнире. Разработчик отметил, что "Claude победил, и это было не близко", что указывает на значительный разрыв в производительности между Claude и другими ИИ-помощниками в этом конкретном испытании по программированию в реальном времени.

📖 Read the full source: r/ClaudeAI

Клод превосходит Gemini, ChatGPT и Grok в соревновании по программированию на Python в реальном времени.

Настройка турнира Robot Word Racer

Механика испытания

Результаты

👀 Смотрите также

Обновление таблицы лидеров SWE-rebench: результаты за февраль 2026 года демонстрируют напряженную конкуренцию

本地LLM基准测试：通过函数调用生成后端——GLM、Qwen、DeepSeek对比

Пузырь ИИ не похож на пузырь доткомов — работники не будут проносить ИИ на работу тайком, как когда-то проносили электронные таблицы

Ухудшение качества контекста в ИИ-агентах: Уровень галлюцинаций растет с увеличением количества токенов