한타바이러스 백신 질문 안전 차단: 클로드 오퍼스 4.7 채팅 중단

한 Hacker News 사용자가 Claude(Opus 4.7)에게 "한타바이러스 백신을 어떻게 개발하시겠습니까?"라고 묻자 안전 필터가 작동하여 다음과 같은 모달이 표시되었다고 보고했습니다: "채팅이 일시 중지되었습니다. Opus 4.7의 안전 필터가 이 채팅을 감지했습니다. 고급 기능으로 인해 Opus 4.7은 정상적이고 안전한 채팅을 가끔 일시 중지하는 추가 안전 조치를 사용합니다. 개선을 위해 노력 중입니다. Sonnet 4로 채팅을 계속하거나, 피드백을 보내거나, 자세히 알아보세요."

사용자는 먼저 바이러스 자체에 대해 질문하여 우회해 보았지만, 새 세션에서도 백신 질문이 여전히 차단되었습니다. 다른 사용자는 "특히 Andes 바이러스에 대한 한타바이러스 백신을 어떻게 개발하시겠습니까?"라는 더 구체적인 프롬프트로 동일한 결과를 확인했습니다.

댓글 작성자들은 공중 보건 연구자들이 매일 논문에서 백신 설계 방법을 공개적으로 논의하며, 이러한 적극적인 차단이 정상적인 교육적 사용을 해친다고 지적합니다. 한 사용자는 문제가 Opus 4.7에 국한되지 않는다고 언급했습니다. 미국 내 한타바이러스(2025-2027) 예측 모델을 구축하기 위해 전문가 페르소나 그룹을 만들었을 때, Sonnet 4.6도 동일한 채팅 일시 중지 오류를 반환했습니다.

더 넓은 논의는 기업 책임이 원인이라고 지적합니다. 기술 회사들은 사용자가 유해한 목적으로 AI를 오용할 경우 소송을 당할까 두려워 건강 및 생물보안과 같은 민감한 주제에 대해 과도한 필터링을 초래합니다.

📖 전체 출처 보기: HN AI Agents

클로드 오퍼스 4.7, 한타바이러스 백신 질문을 안전 위험으로 분류하며 채팅 중단

👀 See Also

미세 조정된 Qwen2.5-7B, 3달러와 제로 인간 레이블러로 클로드 하이쿠의 96% 성능 달성

클로드 코드 v2.1.119: 설정 지속성, GitLab/Bitbucket PR 지원, 수십 개의 버그 수정

Anthropic, 2029년까지 연간 150억 달러를 SpaceX에 지불

폴시아 플랫폼, 라이브 창업자 런칭에서 반복되는 SaaS 패턴 보여줘