온타리오 감사: AI 기록 시스템의 60%가 약물을 혼동하고, 85%가 정신 건강 세부사항을 놓친다

✍️ OpenClawRadar📅 게시일: May 15, 2026🔗 Source
온타리오 감사: AI 기록 시스템의 60%가 약물을 혼동하고, 85%가 정신 건강 세부사항을 놓친다
Ad

온타리오주 감사원(Office of the Auditor General of Ontario)은 의사와 간호사가 사용하는 승인된 20개의 AI 필기 시스템을 감사하여 의사-환자 녹음을 시뮬레이션하고 정확성을 평가했습니다. 결과는 뚜렷합니다:

  • 20개 중 12개 시스템이 환자 기록에 잘못된 약물 정보를 삽입했습니다.
  • 20개 중 9개는 실제로 논의되지 않은 정보(예: "종괴 없음" 또는 "환자 불안")를 조작했습니다.
  • 20개 중 17개는 녹음에서 핵심 정신 건강 세부 사항을 놓쳤습니다.
  • 20개 중 6개는 정신 건강 문제를 완전히 또는 부분적으로 생략했습니다.

감사는 또한 평가 점수 매기기 방법론을 비판했습니다. 의료 기록의 정확성은 전체 점수의 4%만을 차지한 반면, 온타리오 내 국내 입지는 30%를 기여했습니다. 편향 통제, 위협/위험/개인정보 평가, SOC 2 Type 2 준수는 각각 2~4%만을 차지했습니다. 보고서에 따르면, 이러한 가중치는 "AI 도구가 부정확하거나 편향된 의료 기록을 생성할 수 있는 공급업체가 선택되는 결과를 초래할 수 있습니다."

OntarioMD는 AI 기록의 수동 검토를 권장했지만, 감사는 승인된 시스템에 의무 인증 기능(mandatory attestation feature)이 없다고 지적했습니다. 온타리오 보건부는 5,000명 이상의 의사가 이러한 도구를 사용하며 환자 피해가 보고되지 않았다고 밝혔습니다.

📖 전체 출처 읽기: HN AI Agents

Ad

👀 See Also

🦀
News

파라미터 골프: OpenAI의 AI 지원 머신러닝 연구 실험

OpenAI는 파라미터 골프(Parameter Golf) 대회를 개최했습니다. 1,000명 이상의 참가자와 2,000개 이상의 제출물이 참여한 이 대회는 엄격한 제약 하에 AI 지원 머신러닝, 코딩 에이전트, 양자화 및 새로운 모델 설계를 테스트했습니다.

OpenClawRadar
🦀
News

Opus 4.7의 주의력 저하: 256k 컨텍스트에서 MRCR 점수 92%에서 59%로 하락

Opus 4.7은 MRCR v2 8-니들 테스트에서 상당한 재현율 하락을 보입니다: 256k 맥락에서 91.9%에서 59.2%로, 1M에서는 78.3%에서 32.2%로 떨어졌습니다. Anthropic은 MRCR을 폐기하고 Graphwalks로 전환 중이지만, 이러한 성능 저하는 사용자 보고와 일치합니다.

OpenClawRadar
Claude-Code v2.1.80은 속도 제한 모니터링, 플러그인 개선, 메모리 최적화 기능을 추가했습니다.
News

Claude-Code v2.1.80은 속도 제한 모니터링, 플러그인 개선, 메모리 최적화 기능을 추가했습니다.

Claude-Code v2.1.80는 Claude.ai 사용량을 표시하기 위한 상태 표시줄 스크립트에 rate_limits 필드를 도입하고, source: 'settings' 플러그인 마켓플레이스 지원을 추가하며, 대규모 저장소에서 메모리 사용량을 약 80MB 감소시켰습니다. 이번 릴리스에서는 병렬 도구 결과 복원, WebSocket 실패, 다양한 UI 문제도 수정되었습니다.

OpenClawRadar
AMD 라이젠 AI NPU, 레모네이드 10.0 및 패스트플로우LM을 통해 리눅스 LLM 지원 획득
News

AMD 라이젠 AI NPU, 레모네이드 10.0 및 패스트플로우LM을 통해 리눅스 LLM 지원 획득

AMD Ryzen AI NPU가 이제 Linux 7.0 커널 또는 AMDXDNA 드라이버 백포트를 요구하는 FastFlowLM 런타임과 Lemonade 10.0 서버를 통해 Linux에서 대규모 언어 모델을 실행할 수 있게 되었습니다.

OpenClawRadar