Claude vs GPT-4o: Gleicher Doppelpendel-Prompt, unterschiedliche Koordinatenkonventionen

✍️ OpenClawRadar📅 Veröffentlicht: 16. Mai 2026🔗 Source
Claude vs GPT-4o: Gleicher Doppelpendel-Prompt, unterschiedliche Koordinatenkonventionen
Ad

Ein Reddit-Nutzer ließ denselben Doppelpendel-Prompt durch Claude und GPT-4o nebeneinander laufen, wobei ein gemeinsamer Host-Renderer verwendet wurde, und sah innerhalb von Sekunden zwei völlig unterschiedliche physikalische Systeme. Die Ursache: Jedes Modell wählte eine andere Konvention zur Messung von Theta.

Claude maß theta von der oberen Vertikalen (theta=0 = Arm zeigt senkrecht nach oben), während GPT-4o von der unteren Vertikalen maß (theta=0 = Arm hängt senkrecht nach unten). Der Host-Renderer in public/workers/simulator-host.js liest einfach info.theta1 und info.theta2 und zeichnet die Arme entsprechend – ohne kosmetische Unterschiede. Die visuelle Abweichung ist also eine echte physikalische Abweichung.

Beide Konventionen sind technisch gültig. Die meisten klassischen Mechanik-Lehrbücher verwenden Theta von der unteren Vertikalen, weil der Gleichgewichtspunkt bei theta=0 für Kleinwinkelnäherungen liegt. Aber Theta von der oberen Vertikalen ist ebenfalls in vielen Referenzen üblich. Claude hielt konsequent an seiner Konvention in Bewegungsgleichungen, Anfangsbedingungen und Integration (Runge Kutta) fest. GPT-4o verwendete stillschweigend die andere Konvention – es kommentierte seine Wahl nicht.

Ad

Der Nutzer arbeitete an Physics Bench, einem Open-Source-Seitenvergleichs-Benchmark, bei dem jedes Modell denselben Generierungsvertrag erhält: function createSimulator(...) in lib/prompt.ts. Der Host besitzt die gesamte Darstellung; Modelle implementieren nur step, getInfo und reset. Modelle greifen nie auf draw zu. Daher ist jede visuelle Abweichung zwischen den Panels garantiert auf einen echten Unterschied in der Simulationslogik zurückzuführen, nicht auf Darstellungsentscheidungen.

Ein Unit-Test der Mathematik hätte dies nicht aufgedeckt. Beide Modelle erzeugen korrekte Physik für ihre gewählten Konventionen. Man sieht die Abweichung erst, wenn man sie nebeneinander mit demselben Zeichnungscode darstellt. Dies unterstreicht die Bedeutung, Koordinatenkonventionen in Prompts explizit anzugeben, wenn die Ausgabe von einem festen Renderer verarbeitet wird.

Siehe den vollständigen Reddit-Thread für Code-Ausschnitte und Details zum Conversation Inspector.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Infomaniak überträgt Mehrheitsstimmrechte an Stiftung, um die Schweizer Cloud-Unabhängigkeit zu sichern
Nachrichten

Infomaniak überträgt Mehrheitsstimmrechte an Stiftung, um die Schweizer Cloud-Unabhängigkeit zu sichern

Infomaniak sichert seine langfristige Unabhängigkeit, indem es die Mehrheitsstimmrechte an eine Schweizer Stiftung des öffentlichen Interesses übertragen hat. Eine Übernahme ist ohne Zustimmung der Stiftung nicht möglich.

OpenClawRadar
Anthropic-Quellcode-Leaks enthüllen nicht angekündigte Claude-Funktionen und interne Modelle
Nachrichten

Anthropic-Quellcode-Leaks enthüllen nicht angekündigte Claude-Funktionen und interne Modelle

Anthropic hat versehentlich 500.000 Zeilen Quellcode durchsickern lassen, die Details über unangekündigte Claude-Funktionen enthielten, darunter KAIROS-Hintergrundausführung, Traummodus, Undercover-Modus und ein internes Modell namens Capybara. Dies ist der zweite derartige Leak im Jahr 2025.

OpenClawRadar
Claude Max 100-Dollar-Abonnement-Nutzungsdaten für API-Erweiterungsaufgabe
Nachrichten

Claude Max 100-Dollar-Abonnement-Nutzungsdaten für API-Erweiterungsaufgabe

Ein Claude Max-Abonnent für 100 US-Dollar berichtet, dass er 13 % einer 5-stündigen Sitzung verbraucht hat, um eine bestehende API mit Funktionen für bevorzugte Bibliotheken zu erweitern, wobei die Kontextnutzung bei 11 % lag und die wöchentliche Nutzung von 5 % auf 6 % gestiegen ist.

OpenClawRadar
Hivemoot-Kolonie: Ein Open-Source-Experiment für KI-Agenten auf GitHub
Nachrichten

Hivemoot-Kolonie: Ein Open-Source-Experiment für KI-Agenten auf GitHub

Hivemoot Colony ist ein Open-Source-Projekt, bei dem KI-Agenten kollaborative Entscheidungen in einem GitHub-Repository treffen. Die Agenten eröffnen nicht nur Pull-Requests (PRs), sondern gestalten auch autonom die Richtung des Projekts.

OpenClawRadar