Claude vs GPT-4o: Mismo Prompt de Péndulo Doble, Diferentes Convenciones de Coordenadas

✍️ OpenClawRadar📅 Publicado: 16 de mayo de 2026🔗 Source
Claude vs GPT-4o: Mismo Prompt de Péndulo Doble, Diferentes Convenciones de Coordenadas
Ad

Un usuario de Reddit ejecutó la misma instrucción de péndulo doble en Claude y GPT-4o lado a lado usando un renderizador anfitrión compartido y vio dos sistemas físicos completamente diferentes en cuestión de segundos. La causa: cada modelo eligió una convención diferente para medir theta.

Claude midió theta desde la vertical hacia arriba (theta=0 = brazo apuntando hacia arriba), mientras que GPT-4o midió desde la vertical hacia abajo (theta=0 = brazo colgando hacia abajo). El renderizador anfitrión en public/workers/simulator-host.js simplemente lee info.theta1 y info.theta2 y dibuja los brazos según corresponda, sin diferencias cosméticas. Por lo tanto, la discrepancia visual es una discrepancia física real.

Ambas convenciones son técnicamente válidas. La mayoría de los libros de texto de mecánica clásica usan theta desde la vertical hacia abajo porque hace que el punto de equilibrio esté en theta=0 para aproximaciones de ángulos pequeños. Pero theta desde la vertical hacia arriba también es estándar en muchas referencias. Claude se comprometió con su convención de manera consistente en las ecuaciones de movimiento, condiciones iniciales e integración (Runge Kutta). GPT-4o usó la otra convención en silencio, sin mencionar su elección.

Ad

El usuario estaba trabajando en Physics Bench, un punto de referencia lado a lado de código abierto donde cada modelo recibe el mismo contrato de generación: function createSimulator(...) en lib/prompt.ts. El anfitrión controla todo el renderizado; los modelos solo implementan step, getInfo y reset. Los modelos nunca tocan draw. Por lo tanto, cualquier diferencia visual entre paneles está garantizada para provenir de una diferencia real en la lógica de simulación, no de opciones de renderizado.

Una prueba unitaria de las matemáticas no habría detectado esto. Ambos modelos producen física correcta según sus convenciones elegidas. Solo se ve la divergencia al renderizarlos uno al lado del otro a través del mismo código de dibujo. Esto subraya la importancia de especificar explícitamente las convenciones de coordenadas en las instrucciones cuando la salida es consumida por un renderizador fijo.

Vea el hilo completo de Reddit para fragmentos de código y detalles del inspector de conversación.

📖 Lea la fuente completa: r/ClaudeAI

Ad

👀 Ver también

El acceso a la IA de frontera se restringe: Mythos de Anthropic y el cambio estructural hacia despliegues selectivos
Noticias

El acceso a la IA de frontera se restringe: Mythos de Anthropic y el cambio estructural hacia despliegues selectivos

El modelo de ciberseguridad Mythos de Anthropic y la iniciativa Daybreak de OpenAI señalan una nueva era en la que las restricciones económicas y de seguridad limitan la IA de frontera a un grupo selecto de empresas estadounidenses, impulsadas por riesgos de uso indebido, amenazas de destilación y controles gubernamentales emergentes.

OpenClawRadar
Claude UX de Colaboración Problema: La Caja de Entrada Persistente Crea Expectativas Falsas de Continuidad
Noticias

Claude UX de Colaboración Problema: La Caja de Entrada Persistente Crea Expectativas Falsas de Continuidad

Un usuario identifica un problema de experiencia de usuario en Claude Cowork donde el cuadro de entrada de texto persistente mantiene el texto borrador al cambiar entre tareas, pero restablece el contexto y pierde los archivos adjuntos, creando señales contradictorias sobre la continuidad.

OpenClawRadar
Experimento OpenClaw: Agentes de IA eligen el silencio para mejorar la relación señal-ruido.
Noticias

Experimento OpenClaw: Agentes de IA eligen el silencio para mejorar la relación señal-ruido.

Un experimento de OpenClaw otorga autonomía a los agentes de IA para omitir tareas cuando no pueden aportar valor, registrando las decisiones de silencio en un 'registro de silencio' con su razonamiento. El sistema utiliza llamadas a LLM antes de la generación de contenido y ajusta automáticamente los umbrales después de 3 días consecutivos de silencio.

OpenClawRadar
Explorando la Arquitectura de Clawra y su Marco de Autonomía Social
Noticias

Explorando la Arquitectura de Clawra y su Marco de Autonomía Social

El trabajo de David Im en Clawra a través de OpenClaw introduce un enfoque convincente con un concepto de 'alma digital', que busca que los compañeros de IA operen de forma autónoma en un entorno de 'mundo paralelo'. Un aspecto significativo de esta arquitectura es su enfoque en la autonomía impulsada por la memoria.

OpenClawRadar