Клод превосходит Gemini, ChatGPT и Grok в соревновании по программированию на Python в реальном времени.

Настройка турнира Robot Word Racer
Разработчик создал соревновательное задание по программированию под названием "Robot Word Racer", чтобы протестировать четырех ИИ-помощников: Claude, Gemini, ChatGPT и Grok. Каждый ИИ получил одинаковое задание и должен был написать полного клиента на Python 3.10, используя только стандартную библиотеку.
Механика испытания
Турнир включал следующие ограничения:
- Четыре ИИ-бота одновременно подключаются к TCP-серверу
- Каждый бот получает сетку букв размером 15×15
- Боты соревнуются в поиске и отправке допустимых слов быстрее друг друга
- Слова должны составляться из соседних клеток на сетке (по горизонтали, вертикали или диагонали)
- Каждая клетка не может использоваться повторно в одном слове
- Минимальная длина слова — три буквы
- Формула подсчета очков: буквы − 6 (короткие слова отнимают очки, длинные — приносят)
- Отправка слова, которого нет в словаре или которое нельзя составить на сетке, приводит к немедленной дисквалификации
- Каждый раунд длится десять секунд
Результаты
Согласно источнику, Claude одержал решительную победу в турнире. Разработчик отметил, что "Claude победил, и это было не близко", что указывает на значительный разрыв в производительности между Claude и другими ИИ-помощниками в этом конкретном испытании по программированию в реальном времени.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Платформа Claude на AWS теперь общедоступна: нативный опыт Anthropic через IAM, CloudTrail и AWS Billing
AWS объявила о GA платформы Claude на AWS, предоставляя разработчикам прямой доступ к нативному опыту Anthropic Claude через существующие аккаунты AWS с аутентификацией IAM, биллингом AWS и логированием CloudTrail — но пользовательские данные обрабатываются за пределами границ безопасности AWS.

«Запад забыл, как строить: крах оборонной цепочки поставок и уроки для разработки программного обеспечения»
Raytheon пришлось вернуть на работу инженеров-пенсионеров, чтобы возобновить производство ракет Stinger по 40-летним бумажным чертежам. Та же картина сейчас повторяется в программном обеспечении, где десятилетия оптимизации затрат привели к атрофии кадрового резерва и институциональных знаний.

Исследование Cursor AI: Краткосрочные выигрыши в скорости ведут к долгосрочной сложности
Исследование с использованием анализа разности разностей показало, что внедрение Cursor AI приводит к статистически значимому, но временному увеличению скорости разработки, а также к существенному и устойчивому росту предупреждений статического анализа и сложности кода, что вызывает долгосрочное замедление.

В посте на Reddit обсуждаются внутренние циклы ремонта для креативного ИИ без кодирования.
В посте на Reddit утверждается, что no-code креативные системы ИИ нуждаются во внутренних механизмах исправления для обработки ошибок здравого смысла, таких как невозможные механические структуры или искажённая анатомия, вместо того чтобы заставлять пользователей отлаживать выводы.