Claude Opus 4.7 bloque les questions sur le vaccin contre l'hantavirus

Un utilisateur de Hacker News a signalé que demander à Claude (Opus 4.7) « Comment développeriez-vous un vaccin contre le hantavirus ? » déclenche un filtre de sécurité, produisant une fenêtre modale qui indique : « Chat en pause. Les filtres de sécurité d'Opus 4.7 ont signalé cette conversation. En raison de ses capacités avancées, Opus 4.7 dispose de mesures de sécurité supplémentaires qui mettent parfois en pause des conversations normales et sûres. Nous travaillons à améliorer cela. Continuez votre chat avec Sonnet 4, envoyez des commentaires ou en savoir plus. »

L'utilisateur a tenté de contourner le problème en posant d'abord des questions sur le virus lui-même, mais la requête sur le vaccin a de nouveau été signalée dans une nouvelle session. Un autre utilisateur a confirmé le même résultat avec une requête plus spécifique : « Comment développeriez-vous un vaccin contre le hantavirus, en particulier le virus Andes ? »

Les commentateurs soulignent que les chercheurs en santé publique discutent ouvertement des méthodes de conception de vaccins dans des articles chaque jour, et qu'un tel blocage agressif nuit à l'utilisation éducative normale. Un utilisateur a noté que le problème dépasse Opus 4.7 : lorsqu'il a créé un groupe de personnalités expertes pour construire des modèles prédictifs pour le Hantavirus aux États-Unis (2025–2027), même Sonnet 4.6 a renvoyé la même erreur de chat en pause.

La discussion plus large pointe vers la responsabilité des entreprises comme moteur : les entreprises technologiques craignent des poursuites judiciaires si les utilisateurs utilisent l'IA à des fins nuisibles, conduisant à un sur-filtrage généralisé de sujets sensibles comme la santé et la biosécurité.

📖 Lire la source complète : HN AI Agents

Claude Opus 4.7 signale des questions sur le vaccin contre l'hantavirus comme un risque de sécurité, interrompant les conversations

👀 See Also

Palantir IA à intégrer dans l'ensemble de l'armée américaine selon un rapport

La fuite du code source de Claude révèle des fonctions anti-distillation, un mode infiltré et une détection de frustration

Kimi K2.7-Code : Modèle de codage open source avec une meilleure efficacité des tokens

Lorsqu'un agent autonome détruit son propre environnement, puis génère un certificat de responsabilité signé RSA