Claude Opus 4.7 señala preguntas sobre la vacuna contra el hantavirus como riesgo de seguridad, pausando chats

Un usuario de Hacker News informó que preguntar a Claude (Opus 4.7) "¿Cómo desarrollarías una vacuna para el hantavirus?" activa un filtro de seguridad, generando un modal que dice: "Chat pausado. Los filtros de seguridad de Opus 4.7 marcaron este chat. Debido a sus capacidades avanzadas, Opus 4.7 tiene medidas de seguridad adicionales que ocasionalmente pausan chats normales y seguros. Estamos trabajando para mejorar esto. Continúa tu chat con Sonnet 4, envía comentarios o aprende más."
El usuario intentó evitarlo preguntando primero sobre el virus en sí, pero la consulta sobre la vacuna seguía siendo marcada en una nueva sesión. Otro usuario confirmó el mismo resultado con una solicitud más específica: "¿Cómo desarrollarías una vacuna para el hantavirus, específicamente el virus Andes?"
Los comentaristas destacan que los investigadores de salud pública discuten métodos de diseño de vacunas abiertamente en artículos todos los días, y que dicho bloqueo agresivo perjudica el uso educativo normal. Un usuario señaló que el problema va más allá de Opus 4.7: cuando creó un grupo de personas expertas para construir modelos predictivos para Hantavirus en EE. UU. (2025–2027), incluso Sonnet 4.6 devolvió el mismo error de chat pausado.
La discusión más amplia apunta a la responsabilidad corporativa como el motor: las empresas tecnológicas temen demandas si los usuarios utilizan la IA con fines dañinos, lo que lleva a un sobrefiltrado generalizado de temas sensibles como salud y bioseguridad.
📖 Lee la fuente completa: HN AI Agents
👀 Ver también

Spotify lanza insignias 'verificadas' para etiquetar artistas humanos versus actos generados por IA
Spotify añade una insignia de check verde 'Verificado por Spotify' a los perfiles de artistas que cumplen criterios como vinculación a redes sociales, fechas de conciertos o merchandising, con el objetivo de distinguir a los artistas humanos de los generados por IA.

Los Puntos de Referencia Muestran que los Modelos Destilados Igualan a los Modelos de Vanguardia en Tareas Estructuradas con un Costo 10 Veces Menor
Una comparación exhaustiva de modelos pequeños destilados Qwen3 (0.6B a 8B) frente a modelos LLM de vanguardia muestra que los modelos destilados igualan o superan a los modelos de vanguardia de nivel medio en 6 de 9 tareas con un costo dramáticamente menor, con Text2SQL logrando un 98.0% de precisión a $3/M solicitudes versus $378 para Claude Haiku.

Claude Code v2.1.160: Indicaciones de seguridad para la configuración del shell, protección de archivos acceptEdits y docenas de correcciones de errores
Anthropic lanzó Claude Code v2.1.160 con avisos de seguridad antes de escribir en archivos de inicio de shell y configuraciones de herramientas de compilación en modo acceptEdits, mejoró el soporte del portapapeles en Windows y corrigió la pérdida del historial de sesiones.

Sam Altman, Trump y Bernie Sanders se unen por la propiedad pública de la infraestructura de IA
Sam Altman, Donald Trump y Bernie Sanders coinciden en algo poco común: la infraestructura de IA debería ser de propiedad pública. AP informa sobre el interés bipartidista en modelos de propiedad pública para la IA.