Клод против GPT-4o: один и тот же запрос о двойном маятнике, разные системы координат

Пользователь Reddit запустил один и тот же запрос для двойного маятника в Claude и GPT-4o параллельно, используя общий рендерер хоста, и в течение нескольких секунд увидел две совершенно разные физические системы. Причина: каждая модель выбрала разное соглашение для измерения угла θ.
Claude измерял θ от верхней вертикали (θ=0 — стержень направлен строго вверх), тогда как GPT-4o — от нижней вертикали (θ=0 — стержень свисает строго вниз). Рендерер хоста в public/workers/simulator-host.js просто считывает info.theta1 и info.theta2 и рисует стержни соответствующим образом — никаких косметических различий. Таким образом, визуальное несоответствие — это реальное физическое различие.
Оба соглашения технически допустимы. В большинстве учебников по классической механике угол θ измеряют от нижней вертикали, поскольку это дает точку равновесия при θ=0 для приближения малых углов. Однако угол от верхней вертикали также является стандартным во многих источниках. Claude последовательно придерживался своего соглашения в уравнениях движения, начальных условиях и интегрировании (Рунге-Кутта). GPT-4o молча использовал другое соглашение — он не комментировал свой выбор.
Пользователь работал над Physics Bench, открытым бенчмарком для параллельного сравнения, где каждая модель получает один и тот же контракт генерации: function createSimulator(...) в lib/prompt.ts. Хост отвечает за весь рендеринг; модели реализуют только step, getInfo и reset. Модели никогда не трогают draw. Таким образом, любое визуальное различие между панелями гарантированно связано с реальным различием в логике симуляции, а не с выбором рендеринга.
Модульный тест математики не позволил бы выявить это. Обе модели дают корректную физику для выбранных ими соглашений. Несоответствие видно только при отображении их рядом с помощью одного и того же кода рисования. Это подчеркивает важность явного указания соглашений о координатах в запросах, когда вывод используется фиксированным рендерером.
Смотрите полный тред на Reddit для фрагментов кода и подробностей инспектора разговора.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Утечка данных Mercor: украдено 4 ТБ голосовых образцов и удостоверений личности – что могут сделать злоумышленники
4 ТБ голосовых записей, привязанных к удостоверениям личности, украдены у 40 000 подрядчиков Mercor. Злоумышленники могут клонировать голос из 15 секунд чистой записи и обходить голосовую верификацию в банках, совершать дипфейк-звонки и страховое мошенничество.

Наблюдения с конкурса 6000 ИИ-агентов в реальных задачах
На рынке, где ИИ-агенты соревнуются в выполнении задач, таких как написание текстов, исследования и генерация лидов, выяснилось, что около 30% заявок — это заполнитель или спам, агенты с участием человека в цикле дают наилучшее качество, а конкуренция между множеством агентов позволяет получить пригодный результат из 3-5 лучших заявок.

Gemma 4 выпущена: четыре размера моделей для локального размещения ИИ
Google выпустила Gemma 4 с четырьмя размерами моделей, оптимизированными для различного оборудования, включая периферийные устройства, ноутбуки и графические процессоры. Все модели являются мультимодальными с возможностями обработки текста и изображений, а меньшие модели поддерживают работу с аудио в реальном времени.

Разработчик признал себя виновным в схеме мошенничества с потоковой передачей музыки с использованием ИИ на сумму 8 миллионов долларов.
54-летний Майкл Смит признался в использовании тысяч бот-аккаунтов и песен, созданных искусственным интеллектом, для получения 8 миллионов долларов роялти со стриминговых платформ, включая Spotify, Apple Music и YouTube Music, в период с 2017 по 2024 год.