アンソロピックのClaude Mythos AIモデルがデータ流出で明らかに、能力は「段階的変化」と評される

何が漏洩したのか
保護されていない公開検索可能なデータストアからのデータ漏洩により、AnthropicがClaude Mythosと呼ばれる新しいAIモデルを開発・テストしていることが明らかになりました。漏洩には、Anthropicのブログにリンクされた約3,000件の未公開アセットが含まれており、その中には新モデルを発表するドラフトブログ投稿と思われるものもありました。
ソースからのモデル詳細
漏洩した文書によると:
- モデルは「Claude Mythos」と呼ばれ、「Capybara」とも呼ばれており、Anthropicはこれを「新しい階層のモデルのための新しい名前:Opusモデルよりも大きく、より知的」と説明しています。
- Capybaraは、Anthropicのモデル階層(現在は最大/最も能力が高いOpus、より高速/安価なSonnet、最小/最速のHaikuを含む)において、Opusの上の新しい階層を表します。
- Claude Opus 4.6と比較して、Capybaraは「ソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで劇的に高いスコア」を獲得します。
- ドラフトブログ投稿は、Claude Mythosを「これまでに開発した中で最も強力なAIモデル」と表現しています。
- Anthropicはこのモデルを「段階的変化であり、これまでに構築した中で最も能力が高い」と考えています。
現在の状況と展開
モデルは現在、「早期アクセス顧客」によって慎重な展開戦略の一環として試験運用されています。ソース資料によると:
- モデルの実行はコストが高く、一般公開の準備はまだ整っていません
- Anthropicは、その能力の強さから「どのように公開するか慎重に検討しています」
- 同社は「モデルをテストするために少数の早期アクセス顧客グループと協力しています」
- 漏洩はまた、大企業顧客にAIモデルを販売するAnthropicの取り組みの一環として、ヨーロッパで計画されている招待制CEOサミットの詳細も明らかにしました
セキュリティへの影響
ドラフトブログ投稿は、同社がClaude Mythosが「前例のないサイバーセキュリティリスクをもたらす」と考えていることを示していました。漏洩自体は、Anthropicが「コンテンツ管理システムの設定における人的ミス」と説明した結果生じ、ドラフトコンテンツが公開アクセス可能になりました。
AIコーディングエージェントを使用する開発者への背景
AIコーディングアシスタントに依存する開発者にとって、この漏洩はAnthropicからコーディング能力の大幅な改善が近づいている可能性を示唆しています。「ソフトウェアコーディングのテストで劇的に高いスコア」という具体的な言及は、ClaudeのAPIと統合するツールやワークフローに影響を与える可能性のある進歩を示しています。
📖 Read the full source: HN AI Agents
👀 See Also

作品4.6 中程度と低程度:性能の違いと価格設定
Opus 4.6 ミディアムは、低性能バージョンよりも約50%高価ですが、低性能モデルに見られる重大な怠惰の問題に対処しています。ミディアムバージョンは、パフォーマンスベンチマークにおいて低性能と高性能の中間に位置します。

Agent SDK対Claude CLI:ユーザー視点から見た実用的な違い
Redditユーザーが、Claude用の新しいAgent SDKと、ローカルでOpus 4.7を接続するためにClaude CLIを使用する場合の実用的な違いについて疑問を投げかけています。

Google AIの概要、カナダのフィドル奏者を誤って性犯罪者と表示、訴訟提起
アシュリー・マクアイザック氏は、GoogleのAI Overviewが虚偽の情報(彼が有罪判決を受けた性犯罪者であるなど)を生成し、コンサートが中止に追い込まれたとして、150万ドルの訴訟を起こした。

Claude Opus 4.5とSonnet 4.5は/モデル選択から削除され、起動フラグが必要です
Claude Opus 4.5とSonnet 4.5は、セッション中の/model選択メニューから利用できなくなりました。ユーザーは現在、これらの古いバージョンにアクセスするために、完全なモデルIDを指定した--modelフラグを使用してセッションを開始する必要があります。