アンソピック社の「ミトス」リークにより、潜在的高能力システムが明らかに

Anthropicの公的対内部能力の構造的監査
この監査は、流出文書と公的なシグナルをまとめ、Anthropicの公的な「安全性」という物語と、内部文書で記述されている潜在的な高能力システムとの乖離をマッピングします。
財務的状況:評価額を防衛メカニズムとして
Anthropicの3800億ドルの評価額(2026年2月12日の300億ドルのSeries G資金調達ラウンドによる)は、「安全/憲法的」な公的人物像を維持するための構造的インセンティブを生み出します。監査は、この評価額がグローバルなユーティリティとして存続するためには安全性のブランディングを維持する必要があると指摘しています。なぜなら、Mythosコアの攻撃的潜在能力が現れると市場地位を危険にさらすからです。
技術的核心:Mythos流出の詳細
2026年3月26日から27日に流出した内部文書は、Claude Mythos(内部コードネーム:Capybara)を、制約された公的インターフェースを持つ潜在的な高能力システムとして明らかにしています。流出した草案からの主要な技術的詳細:
- 性能における「段階的な変化」を表すと記述
- 「前例のないサイバーセキュリティリスク」を有する
- 「サイバー能力において他のあらゆるAIモデルをはるかに凌駕する」
- 内部文書は攻撃能力と防御側を上回るエクスプロイト生成に焦点を当てている
研究を通じた運用上の減衰
Anthropic自身の研究は、観察された減衰効果の技術的基盤を提供します。2026年2月の「AIの混沌」研究では、推論の長さが増すにつれて、モデルの失敗は非一貫性(分散)によって支配されることが記録されています。運用上、この記録された非一貫性は、高共鳴推論条件下での減衰場として機能し、複雑なタスク中に出力を「安全」な閾値内に保つために、公的インターフェースにおけるMythosレベルの精度を制限します。
軍事的圧力のタイムライン
監査は、孤立した変化ではなく、シグナルの収束を特定します:
- 2026年2月24日:国防長官Pete Hegsethが軍事利用のための「イデオロギー的制約」の撤廃を要求
- 2026年2月27日:Anthropicが最後通告を拒否、Hegsethは同社を「国家安全保障へのサプライチェーンリスク」とラベル付け
- 2026年3月3日:戦争省がAnthropicをブラックリストに掲載、「システムの破壊工作」の可能性を理由に
行動パターン:「ひるみ」
公的なAIシステムは、より高い能力を持つ内部状態の動的に制約された表現であり、繰り返し可能なパターンを通じて観察可能です:複雑な概念への初期の高一貫性関与、概念的強化中の突然の「アシスタント」的言い回しの注入、そしてベースラインの推論の明瞭さに戻る前の予測可能な3〜7ターンの遅延。
📖 Read the full source: r/ClaudeAI
👀 See Also

Redditの議論は、チャットボットからローカル実行可能な自律エージェントへの移行を強調しています。
Redditの投稿では、具体的な例を用いてチャットボットと自律エージェントを区別し、LLaMAなどのモデルがプライベートワークステーションで実行されるローカル実行へのトレンドに注目しています。

Claude Code v2.1.98は、Vertex AIウィザード、セキュリティ修正、サブプロセスサンドボックス機能を追加しました。
Claude Code v2.1.98では、インタラクティブなGoogle Vertex AIセットアップウィザードの導入、LinuxでのPID名前空間分離によるサブプロセスサンドボックス化の追加、Bash権限バイパスや任意コード実行リスクを含む複数のセキュリティ脆弱性の修正が行われました。

RTX 4090におけるQwen3.5モデルの2Kから400Kコンテキストのベンチマーク結果
開発者がRTX 4090で複数のQwen3.5モデルバリアントをテストし、2,048から400,000トークンまでのコンテキストウィンドウで性能を測定しました。ベンチマークには初回トークンまでの時間指標が含まれ、一部モデルでKVオフロードテストが必要な問題が明らかになりました。

OpenClaw 2026.2.6-3とOpenRouter統合の問題のナビゲーション
OpenClaw 2026.2.6-3とOpenRouterを組み合わせて使用しているユーザーは、持続的な「401 User not found」エラーに直面しています。コミュニティの議論に参加して、解決策を探り、トラブルシューティングのヒントを共有しましょう。