Claude Opus 4.7: Riesgo seguridad al preguntar por vacuna hantavirus

Un usuario de Hacker News informó que preguntar a Claude (Opus 4.7) "¿Cómo desarrollarías una vacuna para el hantavirus?" activa un filtro de seguridad, generando un modal que dice: "Chat pausado. Los filtros de seguridad de Opus 4.7 marcaron este chat. Debido a sus capacidades avanzadas, Opus 4.7 tiene medidas de seguridad adicionales que ocasionalmente pausan chats normales y seguros. Estamos trabajando para mejorar esto. Continúa tu chat con Sonnet 4, envía comentarios o aprende más."

El usuario intentó evitarlo preguntando primero sobre el virus en sí, pero la consulta sobre la vacuna seguía siendo marcada en una nueva sesión. Otro usuario confirmó el mismo resultado con una solicitud más específica: "¿Cómo desarrollarías una vacuna para el hantavirus, específicamente el virus Andes?"

Los comentaristas destacan que los investigadores de salud pública discuten métodos de diseño de vacunas abiertamente en artículos todos los días, y que dicho bloqueo agresivo perjudica el uso educativo normal. Un usuario señaló que el problema va más allá de Opus 4.7: cuando creó un grupo de personas expertas para construir modelos predictivos para Hantavirus en EE. UU. (2025–2027), incluso Sonnet 4.6 devolvió el mismo error de chat pausado.

La discusión más amplia apunta a la responsabilidad corporativa como el motor: las empresas tecnológicas temen demandas si los usuarios utilizan la IA con fines dañinos, lo que lleva a un sobrefiltrado generalizado de temas sensibles como salud y bioseguridad.

📖 Lee la fuente completa: HN AI Agents

Claude Opus 4.7 señala preguntas sobre la vacuna contra el hantavirus como riesgo de seguridad, pausando chats

👀 Ver también

Spotify lanza insignias 'verificadas' para etiquetar artistas humanos versus actos generados por IA

Los Puntos de Referencia Muestran que los Modelos Destilados Igualan a los Modelos de Vanguardia en Tareas Estructuradas con un Costo 10 Veces Menor

Claude Code v2.1.160: Indicaciones de seguridad para la configuración del shell, protección de archivos acceptEdits y docenas de correcciones de errores

Sam Altman, Trump y Bernie Sanders se unen por la propiedad pública de la infraestructura de IA