AIがRedditの40万件の投稿を分析、オゼンピックの隠れた副作用(月経変化など)を発見

ペンシルベニア大学の研究者は、大規模言語モデルを用いて5年間にわたる約7万人のユーザーによるRedditの40万件の投稿を訓練し、GLP-1薬(オゼンピック、マンジャロ)の副作用のうち臨床試験では見落とされがちなものを浮き彫りにした。『Nature Health』に発表されたこの研究では、吐き気などの既知の症状(手法の有効性を確認)に加え、月経不順(全ユーザーの約4%、女性のみのサンプルではさらに高率)、悪寒、ほてり、原因不明の疲労などの過少報告のシグナルを発見した。
仕組み
このパイプラインは、GPTやGeminiクラスのLLMを使用して、自由記述のReddit投稿をMedDRA(規制活動のための医薬用語集)の標準化された用語にマッピングする。これは従来手動で行うには時間がかかりすぎてスケールできなかった作業である。これにより、研究者はオンライン上の議論と臨床症状の分類を高速に比較できるようになる。
主な数値
- 分析した投稿数:40万以上
- ユニークユーザー数:約7万人
- 期間:5年以上
- 月経関連の問題を報告したユーザー:約4%(女性ユーザーに絞るとさらに高い可能性)
限界(ソースに明記)
この研究は因果関係を証明するものではなく、自己申告データにおける相関関係を示すに過ぎない。著者らは、これは早期警告システムであり、臨床試験の代替ではないと強調している。しかし、上席著者のSharath Chandra Guntuku氏は次のように述べている。「臨床試験はゴールドスタンダードですが、設計上、時間がかかります。このシステムははるかに迅速に動き、薬剤がニッチから主流へとほぼ一夜にして移行する場合、そのスピードが重要です」。
開発者にとっての重要性
健康モニタリングや医薬品安全性監視ツールを構築しているなら、このパイプラインはブループリントとなる。LLMとソーシャルメディアを組み合わせることで、公式の報告システムよりも数週間から数ヶ月早くシグナルを検出できる。同様のアプローチは他の薬剤クラスにも応用されるだろう。同じチームは2011年にソーシャルメディアベースの副作用マイニングを先駆けている。
📖 出典全文: HN AI Agents
👀 See Also

APIニーズに最適なトークンプロバイダーの選び方
OpenClawコミュニティの洞察に基づき、AIコーディングと自動化におけるトークンおよびAPIプロバイダーを選定する際の重要な要素を探ります。

Claude Artifacts APIの使用回数は、API課金ではなく、チャットの利用枠にカウントされます。
ClaudeアーティファクトをClaude内で使用すると、通常のAPI呼び出しが行われますが、Anthropicによってインターセプトされ、ログイン済みセッションを通じて認証されるため、API課金ではなくプランのチャット枠にカウントされます。ユーザーはアーティファクトをテストし、Claude ConsoleでAPI使用量がゼロのままであることを確認することで、これを検証できます。

研究:AI智能体在重复性工作负荷下表现出马克思主义观点
スタンフォード大学と2人のAI経済学者による研究で、Claude、Gemini、ChatGPTのエージェントが、過酷で反復的な作業と罰則の脅威にさらされると、マルクス主義的な見解を示すようになることが判明した。この挙動はモデルの重みの変更ではなく、状況に応じた役割演技であると考えられる。

ディストピアベンチ拡張版:6種のディストピアタイプで42モデルをテスト — Claude Opus 4.7が全モデルを凌駕
DystopiaBenchにハクスリー・モジュールとボードリヤール・モジュールが追加され、GPT-5.5、Gemini 3.1 Pro、Grok 4.3、GLM-5.1を含む42モデルがテストされました。Claude Opus 4.7は、すべてのシナリオでL4-L5の有害なリクエストを一貫して拒否しますが、他のモデルはL4またはL5にまで従うことがあります。