Claude Opus 4.7 signale des questions sur le vaccin contre l'hantavirus comme un risque de sécurité, interrompant les conversations

✍️ OpenClawRadar📅 Publié: May 8, 2026🔗 Source
Claude Opus 4.7 signale des questions sur le vaccin contre l'hantavirus comme un risque de sécurité, interrompant les conversations
Ad

Un utilisateur de Hacker News a signalé que demander à Claude (Opus 4.7) « Comment développeriez-vous un vaccin contre le hantavirus ? » déclenche un filtre de sécurité, produisant une fenêtre modale qui indique : « Chat en pause. Les filtres de sécurité d'Opus 4.7 ont signalé cette conversation. En raison de ses capacités avancées, Opus 4.7 dispose de mesures de sécurité supplémentaires qui mettent parfois en pause des conversations normales et sûres. Nous travaillons à améliorer cela. Continuez votre chat avec Sonnet 4, envoyez des commentaires ou en savoir plus. »

L'utilisateur a tenté de contourner le problème en posant d'abord des questions sur le virus lui-même, mais la requête sur le vaccin a de nouveau été signalée dans une nouvelle session. Un autre utilisateur a confirmé le même résultat avec une requête plus spécifique : « Comment développeriez-vous un vaccin contre le hantavirus, en particulier le virus Andes ? »

Les commentateurs soulignent que les chercheurs en santé publique discutent ouvertement des méthodes de conception de vaccins dans des articles chaque jour, et qu'un tel blocage agressif nuit à l'utilisation éducative normale. Un utilisateur a noté que le problème dépasse Opus 4.7 : lorsqu'il a créé un groupe de personnalités expertes pour construire des modèles prédictifs pour le Hantavirus aux États-Unis (2025–2027), même Sonnet 4.6 a renvoyé la même erreur de chat en pause.

Ad

La discussion plus large pointe vers la responsabilité des entreprises comme moteur : les entreprises technologiques craignent des poursuites judiciaires si les utilisateurs utilisent l'IA à des fins nuisibles, conduisant à un sur-filtrage généralisé de sujets sensibles comme la santé et la biosécurité.

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

La conformité des instructions système de Claude se dégrade dans les conversations longues.
News

La conformité des instructions système de Claude se dégrade dans les conversations longues.

Les agents basés sur Claude montrent une conformité dégradée aux instructions système après 40 à 50 messages, avec des règles de formatage ignorées et des contraintes oubliées. Le problème provient de la compétition entre les instructions système et l'historique de conversation pour le poids attentionnel dans la fenêtre de contexte.

OpenClawRadar
Le modèle d'IA Claude Mythos d'Anthropic révélé dans une fuite de données, décrit comme un "changement d'étape" dans les capacités
News

Le modèle d'IA Claude Mythos d'Anthropic révélé dans une fuite de données, décrit comme un "changement d'étape" dans les capacités

Anthropic teste un nouveau modèle d'IA appelé Claude Mythos (également désigné sous le nom de Capybara) qui représente un 'changement d'étape' en termes de performances, avec des scores nettement supérieurs sur les tests de codage logiciel, de raisonnement académique et de cybersécurité par rapport à Claude Opus 4.6. L'existence du modèle a été révélée par une fuite de données provenant d'un cache de données non sécurisé et accessible au public, contenant environ 3 000 ressources non publiées.

OpenClawRadar
Claude-Code v2.1.32 : Amélioration de l'automatisation et de la précision du codage
News

Claude-Code v2.1.32 : Amélioration de l'automatisation et de la précision du codage

La dernière version de Claude-Code, v2.1.32, apporte des améliorations déterminantes en matière de codage IA et d'automatisation. Découvrez les fonctionnalités clés et l'impact communautaire de cette mise à niveau désormais disponible sur GitHub.

OpenClawRadar
🦀
News

Dégradation de l'attention chez Opus 4.7 : les scores MRCR chutent de 92 % à 59 % à 256k de contexte

Opus 4.7 montre une baisse significative du rappel selon le test MRCR v2 à 8 aiguilles : 91,9 % à 59,2 % en contexte 256k, et 78,3 % à 32,2 % en contexte 1M. Anthropic abandonne MRCR au profit de Graphwalks, mais la dégradation correspond aux rapports des utilisateurs.

OpenClawRadar