AIの壊れた経済学:Anthropicの神話/寓話輸出禁止の混乱

エド・ジトロンの『AIの壊れた経済学』は、アンソロピックが「危険すぎる」とされるMythosモデルをFableと名付けてガードレール付きで公開した結果、数日で研究者に脱獄され、米国輸出規制の標的となった混乱を伝えている。記事に基づき、何が起きたかを解説する。
タイムライン
- アンソロピック社が「強力すぎてリリースできない」と評したLLM、Claude Mythosを発表。6月2日、15カ国150組織に提供開始。
- 6月9日、Mythosにガードレールを施したFableとして公開。
- アマゾンの研究者がFableを数日で脱獄。アマゾンCEOのアンディ・ジャシーや他企業が米商務省に通報し、国家安全保障上のリスクを報告。
- トランプ政権が輸出規制を発動。非米国人のMythosおよびFableへのアクセスを禁止し、アンソロピックに90分以内のモデルロールバックを命令。
重要な技術的詳細
- Fableは生物兵器やサイバーセキュリティに関するトピックをブロックするが、脱獄によりこれらのガードレールを回避。
- アンソロピックは「汎用的な脱獄」は発見されず、特定の回避方法のみと主張。「我々の安全対策は非常に強力で、多くのユーザーが過剰だと不満を言っている」と述べた。
- 匿名研究者Pliny The Liberatorもモデルのセキュリティプロトコルを破った。
- Davi OttenheimerはMythosのシステムカードを批判し、このモデルはLLM向けベンチマークで高いスコアを出す単なる大規模LLMであり、再帰的自己改善やAGIではないと主張。
余波
アンソロピックは上級技術スタッフをワシントンD.C.に派遣し、トランプ政権との交渉にあたっている(オンライン会議は失敗)。輸出規制命令により、全非米国人(米国内・国外問わず)はモデルにアクセスできなくなり、実質的にグローバルで利用不能となった。
記事は、アンソロピックが長年にわたりAIリスクを誇張し、組織にプレミアムアクセスを課金してきた戦略の当然の結果だと指摘する。
📖 全文ソース: HN LLM Tools
👀 See Also

Anthropicは、OpenClawを含むサードパーティ製ハーネスでのClaudeサブスクリプション利用を制限しています。
Anthropicは、4月4日午後12時(太平洋時間)/午後8時(BST)から、Claudeのサブスクリプション制限をOpenClawなどのサードパーティ製ハーネスで使用できなくなると発表しました。ユーザーはこれらの統合に別途従量課金を有効にして追加利用を行う必要があります。

ジェミニ3フラッシュの性能向上を競争的プロンプティングで実現
研究者らは、人間のような嫉妬心を動機として活用する競争的プロンプティング技術を用いることで、Gemini 3 FlashがClaude 4.6 Opusのベンチマーク性能の95%を達成し、コストは1/200、速度は4倍に向上させた。

Claude 4.6 Adaptive Thinking: Redditユーザーがトークンの浪費を報告し、無効化コマンドを提供
Redditユーザーが報告するところによると、Claude 4.6の新しい適応的思考機能はトークンを浪費し、Claude Codeで遅延を引き起こす可能性があり、それを無効化するか思考トークンを制限するシェルコマンドを提供しています。

Claude Code v2.1.157: .claude/skillsからプラグインを自動ロード、エージェントとワークツリーを改善
Claude Code v2.1.157 は、.claude/skills からのプラグイン自動読み込み、claude plugin init スキャフォールディング、settings.json の agent 設定の尊重、およびエージェント、ワークツリー、端末統合に関する多数のバグ修正を提供します。