オンタリオ州の監査:AI書記システムの60%が薬剤を混同、85%が精神保健の詳細を見逃す

オンタリオ州監査総局は、医師やナースプラクティショナーが使用する20の承認済みAI書記システムを監査し、医師患者間の録音をシミュレートして正確性を評価した。その結果は衝撃的である:
- 20件中12件のシステムが患者記録に誤った薬剤情報を挿入した。
- 20件中9件が情報を捏造——例えば、「腫瘤なし」や「患者は不安」といった、議論されたことのない内容を記録した。
- 20件中17件が録音から精神保健の重要事項を見逃した。
- 20件中6件が精神保健問題を完全または部分的に省略した。
監査はまた、評価スコアリングの方法論を非難した。医療記録の正確性は総合点のわずか4%を占める一方、オンタリオ州内での国内拠点の有無が30%を占めた。偏り対策、脅威・リスク・プライバシー評価、SOC 2 Type 2準拠はそれぞれ2~4%しか占めていない。報告書が指摘するように、このような重み付けは「不正確または偏った医療記録を生成する可能性のあるAIツールを持つベンダーが選ばれる結果につながりかねない」。
オンタリオ州医療省はAIによる記録の手動確認を推奨しているが、監査では承認済みシステムに必須の証明機能がないことが指摘された。オンタリオ州保健省は、5,000人以上の医師がこれらのツールを使用しており、患者への害は報告されていないと述べている。
📖 全文ソース: HN AI Agents
👀 See Also

Mercorデータ漏洩:4TBの音声サンプルとIDが盗難 – 攻撃者が今できること
40000件のMercor契約者から、政府発行身分証明書と紐づけられた4TBの音声録音が流出。攻撃者は15秒のクリーンな音声から声を複製し、銀行の音声認証を突破、ディープフェイク電話や保険詐欺に悪用可能。

RTX 4090 vs H100:Llama-3-8Bのファインチューニングにおけるコストパフォーマンス比較
開発者がLlama-3-8BのファインチューニングをRTX 4090とレンタルしたH100インスタンスの両方でテストしました。4090のセットアップは初期費用2,000ドルで24時間かかりましたが、H100のレンタルは約80ドルで4時間で完了しました。

アトラシアン、AI投資の資金調達のため従業員の10%を削減
AtlassianはAI投資を自己資金で賄い、財務体質を強化するため、1,600人(従業員の10%)を削減。ソフトウェア開発部門では900のポジションが影響を受けます。CEOのMike Cannon-Brookes氏は、AIが人を置き換えるのではなく、必要なスキルを変えると述べています。

Anthropicの新Claudeサブスクリプションクレジット:Agent SDKとclaude -pが6月15日から別々の上限付きプールに
6月15日より、ClaudeサブスクライバーはAgent SDKとclaude -pの使用に対して別途月額クレジットを取得: Max 20xは月額200ドル、Max 5xは100ドル、Proは20ドル。クレジットが枯渇すると、追加課金をオプトインしない限り使用は停止される。インタラクティブなClaude Codeとチャットは従来のサブスクリプションプールのまま。