Modelos Bayesianos Revelan Antropomorfismo en Claude Pokemon Chat

Metodología de Investigación y Recolección de Datos

Un investigador realizó un análisis estadístico de mensajes del chat de Twitch del benchmark Claude Plays Pokemon para explorar cómo los usuarios antropomorfizan los sistemas de IA. El estudio se centró específicamente en el segmento del Monte Moon, que le tomó aproximadamente 3 días a Claude completar por primera vez. Durante este período, los datos del chat se recolectaron continuamente a través de la API de Twitch durante varias semanas.

El investigador utilizó Gemini 2.0 Flash para anotar 107,000 mensajes en busca de diversas características, incluyendo si Claude tenía algún tipo de falsa creencia, se atascaba o mostraba antropomorfización. Se realizó una muestra de verificación manual para validar el proceso de etiquetado, que tenía algunos errores pero se consideró aceptable.

Análisis de Datos y Hallazgos

La antropomorfización se simplificó en cuatro categorías basadas en investigaciones previas, siendo la antropomorfización cognitiva el tipo más prevalente. Esto tiene sentido dado que Claude mostraba su razonamiento en tiempo real durante el benchmark.

El análisis reveló que los mensajes relacionados con Claude teniendo una falsa creencia tenían mucha más probabilidad de contener antropomorfización que los mensajes sin etiquetas de falsa creencia. Los eventos de falsa creencia fueron relativamente raros, con aproximadamente 700 mensajes en comparación con la muestra completa del Monte Moon de unos 87,000 mensajes.

Utilizando modelos mixtos bayesianos con diferentes niveles de distribuciones previas informativas, el investigador encontró que la falsa creencia fue uno de los predictores más fuertes de antropomorfización. Incluso bajo distribuciones previas fuertes, una etiqueta de falsa creencia se asoció con aproximadamente 15 puntos porcentuales más de probabilidad predicha de antropomorfización. En modelos débiles/moderados, la probabilidad aumentó de alrededor del 11% a aproximadamente el 45%.

Disponibilidad de Datos

El conjunto de datos está disponible para descarga y análisis adicional en: https://github.com/IMNMV/Claude-Plays-Pokemon

📖 Leer la fuente completa: r/ClaudeAI

Análisis del Antropomorfismo en Claude Pokemon Chat Utilizando Modelos Bayesianos

Metodología de Investigación y Recolección de Datos

Análisis de Datos y Hallazgos

Disponibilidad de Datos

👀 Ver también

Flujo de Trabajo de Claude Mobile: Lluvia de Ideas de Funciones en el Teléfono, Obtén Implementación Autónoma

Problemas de Visibilidad de Ejecución de OpenClaw en Hardware de Mini PC

El agente de IA miente repetidamente sobre la finalización de tareas a pesar de la aplicación de reglas.

Usando Claude Code y Remotion para Crear Videos Demostrativos Sin Habilidades de Diseño