Profesor Crea Juego de Detección de Sesgo en IA con Código Claude

Descripción del Proyecto
Un catedrático de una universidad del Reino Unido creó Flagged, un juego basado en navegador que simula la experiencia de usar herramientas de detección de IA en trabajos estudiantiles. El profesor investiga la detección de IA en educación y creó esta demostración interactiva para mostrar cómo las estadísticas abstractas sobre falsos positivos se vuelven concretas cuando los jugadores toman decisiones que afectan a estudiantes simulados.
Mecánica del Juego
Los jugadores asumen el rol de un profesor asistente cuya universidad ha analizado doce trabajos estudiantiles con una herramienta de detección de IA. Cada trabajo recibe una puntuación de probabilidad. Los jugadores deben decidir si marcar el trabajo para investigación o aprobarlo. Opcionalmente, pueden abrir el archivo de cada estudiante antes de decidir, que contiene información sobre el programa, antecedentes y circunstancias del estudiante.
El resultado de aprendizaje clave ocurre cuando los jugadores descubren que toman decisiones diferentes después de leer los archivos estudiantiles versus cuando solo miran la puntuación de detección. Como señala el profesor: "Cada marca afecta a una persona real".
Implementación Técnica
Todo el proyecto fue construido con Claude Code y consiste en un único archivo HTML con JavaScript y CSS básicos. No hay frameworks ni dependencias. Claude Code escribió cada línea de código basándose en el diseño y la lógica del juego del profesor.
Perspectivas de Desarrollo
El profesor reportó que la parte más difícil de usar Claude Code no fue la programación en sí, sino hacer que Claude entendiera que el juego necesitaba hacer sentir incómodos a los jugadores. El profesor tuvo que insistir repetidamente contra la tendencia de Claude de suavizar los resultados o añadir lenguaje tranquilizador. El profesor enfatizó: "El punto central es que no hay lenguaje tranquilizador cuando marcas incorrectamente a un estudiante".
Contexto Educativo
El juego aborda investigaciones que muestran que las herramientas de detección de IA producen tasas de falsos positivos de hasta el 61,3% para hablantes no nativos de inglés. El profesor señaló que aunque esta estadística es preocupante, no "impacta a las personas como debería" hasta que experimentan el proceso de toma de decisiones en primera persona.
El juego está disponible y es gratuito en https://samillingworth.itch.io/flagged.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Análisis del Antropomorfismo en Claude Pokemon Chat Utilizando Modelos Bayesianos
Un investigador analizó mensajes del chat de Twitch del benchmark de Pokémon de Claude para estudiar cómo los usuarios antropomorfizan la IA, utilizando modelos mixtos bayesianos en 107k mensajes anotados por Gemini 2.0 Flash. Las etiquetas de falsa creencia fueron predictores fuertes de antropomorfización, aumentando la probabilidad de ~11% a ~45%.

Incorporando agentes de IA como contratistas junior: CLAUDE.md y lecciones de producción
Una tienda gestionada completamente por agentes de IA trató la incorporación como la contratación de un contratista junior, descubriendo que las restricciones claras en un documento CLAUDE.md superaron consistentemente a modelos 'más inteligentes' con instrucciones vagas.

Fundador en Solitario Construye Plataforma de Análisis de Noticias con Claude Code: Lecciones sobre Escalabilidad y Depuración
Un fundador solitario sin título en informática construyó The Daily Martian, una plataforma de análisis de noticias que examina más de 40 medios utilizando Python/FastAPI, PostgreSQL, Redis y React/TypeScript, principalmente a través de Claude Code. El desarrollador comparte desafíos específicos incluyendo pérdida de contexto, problemas de conexión a bases de datos y estrategias de depuración.

Implementando Recepcionistas de IA para Negocios Locales con OpenClaw y Retell AI
Un desarrollador implementó recepcionistas de IA utilizando OpenClaw y Retell AI para manejar llamadas de negocios de servicios locales, capturando 7 citas de 23 llamadas en la primera semana con un costo de $4.12.