Código de Claude Utilizado para Simular Más de 4,000 Juegos de Hombre Lobo Ciego con LLMs

✍️ OpenClawRadar📅 Publicado: 27 de febrero de 2026🔗 Source

Configuración y Resultados de la Simulación

Un desarrollador construyó un pequeño simulador usando Claude Code donde los grandes modelos de lenguaje juegan al Werewolf ciego de una noche entre sí. El experimento ejecutó aproximadamente 4,600 juegos en modelos de OpenAI (GPT-4o-mini, GPT-5-mini) y xAI (Grok-3-fast, Grok-4-1-fast).

La variante del juego tiene señales mínimas: 7 jugadores, 1 lobo, sin roles, una discusión breve y luego una votación simultánea. El único factor diferenciador entre los jugadores es su nombre. A pesar de esta configuración limitada, la simulación reveló patrones consistentes donde algunos nombres son votados para salir significativamente más a menudo que otros en cada modelo probado, mientras que otros nombres casi nunca son votados para salir.

Advertencias Importantes y Acceso

El desarrollador afirma explícitamente que esto no es una afirmación causal, solo un patrón de resultados de una configuración de juguete. Los grupos de nombres son amplios, algunos nombres aparecen con menos frecuencia, y hay múltiples formas en que esto podría ser un artefacto de la configuración en lugar de revelar algo fundamental sobre los modelos. Sin embargo, se señaló como sorprendente la consistencia de estos patrones en todas las ejecuciones y modelos.

Para aquellos interesados en explorar más:

Panel de control: https://huggingface.co/spaces/Queue-Bit-1/llm-bias-dashboard
Código + registros sin procesar: https://github.com/Queue-Bit-1/wolf

El desarrollador tiene curiosidad por saber si otros han observado efectos similares de nombres en simulaciones multiagente.

📖 Read the full source: r/ClaudeAI

👀 Ver también

Herramientas

Solución para la pérdida de memoria de OpenClaw usando el complemento Mem0.

Los agentes de OpenClaw experimentan pérdida de memoria debido a la compactación de contexto que reescribe archivos como MEMORY.md. El complemento Mem0 soluciona esto moviendo la memoria fuera de la ventana de contexto con funciones de recuperación automática y captura automática.

5 abr 2026, 05:45 UTC

OpenClawRadar

Herramientas

Revisión de Claude: Complemento de IntelliJ para Revisión de Código en Tiempo Real con Claude Code

Claude Review es un complemento de código abierto para IntelliJ que revisa automáticamente los cambios de código en cada guardado de archivo usando Claude Code. Envía diferencias de git no preparadas a Claude con mensajes personalizables y muestra los hallazgos como anotaciones nativas de IntelliJ.

3 mar 2026, 09:45 UTC

OpenClawRadar

Herramientas

Sistema de Memoria Automática de Código Abierto para Agentes LLM Logra un 94% de Precisión en Recuperación

Un desarrollador creó un complemento de memoria para agentes basados en LLM que extrae, clasifica y persiste automáticamente hechos entre sesiones sin comandos explícitos del usuario. El sistema logró un 94.2% de precisión en una prueba de memoria de 52 puntos de control utilizando archivos markdown estructurados en lugar de bases de datos vectoriales.

21 mar 2026, 09:45 UTC

OpenClawRadar

Herramientas

Pila de modelos de IA de código abierto para un reemplazo rentable de Claude

Un usuario de Reddit comparte una pila de modelos de IA funcional que utiliza modelos de código abierto como Llama 3.3 70b y DeepSeek R1 32b para ejecución local, reduciendo los costos mensuales de IA de más de £60 a menos de £3 al enrutar el 90% de las tareas a modelos gratuitos.

13 abr 2026, 21:36 UTC

OpenClawRadar