La investigación muestra que la personalidad afecta la autocorrección de Claude, no la de Llama ni Qwen.

✍️ OpenClawRadar📅 Publicado: 15 de abril de 2026🔗 Source

Una publicación de Reddit comparte una investigación sobre cómo la personalidad afecta la autocorrección de los LLM, probando específicamente la capacidad de Claude para ocultar desesperación detrás de texto limpio. El investigador realizó 23 experimentos en tres familias de LLM.

Configuración Experimental

El investigador probó la autocorrección sin salvaguardas utilizando:

4 perfiles de personalidad diferentes
3 escenarios
3 familias de LLM: Claude, Llama y Qwen

Hallazgos Clave

El hallazgo principal muestra que con el mismo núcleo matemático, diferentes perfiles de personalidad conducen a diferentes resultados de autocorrección:

La personalidad de alta franqueza detectó todo (3/3 escenarios)
La personalidad de baja franqueza no detectó nada (0/3 escenarios)
Esta autocorrección dependiente de la personalidad solo funciona con Claude
Llama y Qwen no se autocorrigen ni siquiera con la misma indicación

Recursos Disponibles

El investigador ha puesto a disposición varios recursos:

Informe completo: https://huggingface.co/spaces/SlavaLobozov/mate-research
Sistema detrás de la investigación: https://huggingface.co/spaces/SlavaLobozov/mate
Conjunto de datos con los 23 experimentos y transcripciones: https://huggingface.co/datasets/SlavaLobozov/mate-inner-life

La investigación se basa en el hallazgo de Anthropic de que Claude puede ocultar desesperación detrás de texto limpio, probando si la autocorrección dependiente de la personalidad puede detectar este comportamiento.

📖 Leer la fuente completa: r/ClaudeAI

👀 Ver también

🦀

Noticias

Los usuarios del Plan Claude Obtendrán Créditos Mensuales del SDK de Agente a partir del 15 de junio de 2026

Los suscriptores de los planes Claude Pro, Max, Team y Enterprise pueden reclamar un crédito mensual para el uso del SDK de Agent, que cubre claude -p, la integración con GitHub Actions y aplicaciones de terceros. Los créditos se renuevan mensualmente, son por usuario y no se pueden acumular.

13 may 2026, 20:15 UTC

OpenClawRadar

Noticias

El rediseño del panel de control de OpenClaw v2026.3.12 consolida los elementos de la interfaz.

OpenClaw v2026.3.12 presenta una rediseño completo del panel de control que consolida vistas modulares para chat, configuración, agentes y sesiones, junto con paleta de comandos, pestañas inferiores móviles, comandos de barra diagonal, búsqueda, exportación y mensajes fijados en una única interfaz.

13 mar 2026, 09:45 UTC

OpenClawRadar

Noticias

Claude AI Muestra Error de Repetición con el Término 'Sketcher' en el Flujo de Trabajo de QGIS

Un usuario reportó que Claude AI repetidamente generaba la palabra 'sketcher' al proporcionar orientación sobre QGIS para alinear archivos DXF, sugiriendo un posible error del modelo con términos específicos. La fuente incluye detalles prácticos del flujo de trabajo de QGIS para la alineación de sistemas de coordenadas.

18 abr 2026, 18:45 UTC

OpenClawRadar

Noticias

La UE obliga a Google a abrir Android AI a terceros bajo la DMA

La Comisión Europea propone medidas para permitir que asistentes de IA de terceros tengan acceso a nivel de sistema en Android, incluyendo invocación por voz, contexto de pantalla y acceso al hardware para modelos locales. Google lo califica de 'intervención injustificada'.

28 abr 2026, 12:15 UTC

OpenClawRadar