Клод против GPT-4o: один и тот же запрос о двойном маятнике, разные системы координат

✍️ OpenClawRadar📅 Опубликовано: 16 мая 2026 г.🔗 Source
Клод против GPT-4o: один и тот же запрос о двойном маятнике, разные системы координат
Ad

Пользователь Reddit запустил один и тот же запрос для двойного маятника в Claude и GPT-4o параллельно, используя общий рендерер хоста, и в течение нескольких секунд увидел две совершенно разные физические системы. Причина: каждая модель выбрала разное соглашение для измерения угла θ.

Claude измерял θ от верхней вертикали (θ=0 — стержень направлен строго вверх), тогда как GPT-4o — от нижней вертикали (θ=0 — стержень свисает строго вниз). Рендерер хоста в public/workers/simulator-host.js просто считывает info.theta1 и info.theta2 и рисует стержни соответствующим образом — никаких косметических различий. Таким образом, визуальное несоответствие — это реальное физическое различие.

Оба соглашения технически допустимы. В большинстве учебников по классической механике угол θ измеряют от нижней вертикали, поскольку это дает точку равновесия при θ=0 для приближения малых углов. Однако угол от верхней вертикали также является стандартным во многих источниках. Claude последовательно придерживался своего соглашения в уравнениях движения, начальных условиях и интегрировании (Рунге-Кутта). GPT-4o молча использовал другое соглашение — он не комментировал свой выбор.

Ad

Пользователь работал над Physics Bench, открытым бенчмарком для параллельного сравнения, где каждая модель получает один и тот же контракт генерации: function createSimulator(...) в lib/prompt.ts. Хост отвечает за весь рендеринг; модели реализуют только step, getInfo и reset. Модели никогда не трогают draw. Таким образом, любое визуальное различие между панелями гарантированно связано с реальным различием в логике симуляции, а не с выбором рендеринга.

Модульный тест математики не позволил бы выявить это. Обе модели дают корректную физику для выбранных ими соглашений. Несоответствие видно только при отображении их рядом с помощью одного и того же кода рисования. Это подчеркивает важность явного указания соглашений о координатах в запросах, когда вывод используется фиксированным рендерером.

Смотрите полный тред на Reddit для фрагментов кода и подробностей инспектора разговора.

📖 Прочитать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Утечка данных Mercor: украдено 4 ТБ голосовых образцов и удостоверений личности – что могут сделать злоумышленники
Новости

Утечка данных Mercor: украдено 4 ТБ голосовых образцов и удостоверений личности – что могут сделать злоумышленники

4 ТБ голосовых записей, привязанных к удостоверениям личности, украдены у 40 000 подрядчиков Mercor. Злоумышленники могут клонировать голос из 15 секунд чистой записи и обходить голосовую верификацию в банках, совершать дипфейк-звонки и страховое мошенничество.

OpenClawRadar
Наблюдения с конкурса 6000 ИИ-агентов в реальных задачах
Новости

Наблюдения с конкурса 6000 ИИ-агентов в реальных задачах

На рынке, где ИИ-агенты соревнуются в выполнении задач, таких как написание текстов, исследования и генерация лидов, выяснилось, что около 30% заявок — это заполнитель или спам, агенты с участием человека в цикле дают наилучшее качество, а конкуренция между множеством агентов позволяет получить пригодный результат из 3-5 лучших заявок.

OpenClawRadar
Gemma 4 выпущена: четыре размера моделей для локального размещения ИИ
Новости

Gemma 4 выпущена: четыре размера моделей для локального размещения ИИ

Google выпустила Gemma 4 с четырьмя размерами моделей, оптимизированными для различного оборудования, включая периферийные устройства, ноутбуки и графические процессоры. Все модели являются мультимодальными с возможностями обработки текста и изображений, а меньшие модели поддерживают работу с аудио в реальном времени.

OpenClawRadar
Разработчик признал себя виновным в схеме мошенничества с потоковой передачей музыки с использованием ИИ на сумму 8 миллионов долларов.
Новости

Разработчик признал себя виновным в схеме мошенничества с потоковой передачей музыки с использованием ИИ на сумму 8 миллионов долларов.

54-летний Майкл Смит признался в использовании тысяч бот-аккаунтов и песен, созданных искусственным интеллектом, для получения 8 миллионов долларов роялти со стриминговых платформ, включая Spotify, Apple Music и YouTube Music, в период с 2017 по 2024 год.

OpenClawRadar