Microsoft、Claude Codeライセンスをキャンセル — AIエージェントのスケールが高コストに

マイクロソフトは、内部利用向けのClaude Code直接ライセンスをほとんどキャンセルし、エンジニアをGitHub Copilot CLIに戻していると、The Vergeが報じた。この方針転換は、同社がClaude Codeへのアクセスを開放し、数千人の開発者、プロダクトマネージャー、デザイナーにエージェンティックコーディングツールの試用を促してから6ヶ月後のことだ。人気が出すぎて、コストがかさみすぎたのだ。
主な詳細
- マイクロソフトのAnthropicとのFoundry契約(50億ドルの投資、300億ドルのAzureコンピュートコミットメント)には影響なし。削減されるのは内部向けClaude Codeの直接ライセンスのみ。
- UberのCTOであるPraveen Neppalli Naga氏は4月、The Informationに対し、社内リーダーボードで導入を促進した結果、2026年のAIコーディングツール予算全体をわずか4ヶ月で使い果たしたと語った。
- Metaには「Claudeonomics」という、従業員ごとのAIトークン使用量を追跡するリーダーボードがある。Amazonは「toxenmaxx」を推進し、消費トークンの最大化を図っている。
- ゴールドマン・サックスは、エージェンティックAIにより2030年までにトークン消費が24倍に増加し、月間120京トークンに達する可能性があると予測している。
- ガートナーは、1兆パラメータのLLMの推論コストは2025年比で2030年までに約90%低下すると予測するが、エージェンティックモデルはタスクあたりのトークン消費がはるかに多く、AIプロバイダーがコスト削減分を顧客に完全に還元することはないため、企業全体のAI支出は依然として増加する。
NvidiaのVPであるBryan Catanzaro氏は次のように要約している。「私のチームにとって、計算コストは従業員のコストをはるかに上回っている」。
結論
AIエージェントの経済性は逆転している。トークンが安くなっても、請求額が安くなるとは限らない。マイクロソフトやUberが気づきつつあるように、エージェントを大規模に展開すると、トークン消費は価格低下を上回るペースで増加する。2026年のAIツールの予算を立てるなら、ベースラインから3〜5倍のコスト増を見込んでおくべきだ。プロバイダーが固定料金や使用量上限付きのプランに切り替えない限り。
📖 出典全文: HN AI Agents
👀 See Also

GPT 5.5 vs Claude:開発者のリファクタリング戦記
ある開発者がGPT 5.5を使って計画を立て、Claudeを使ってコードを書くことで、36,000行ものCコードの大規模リファクタリングを実現しました。GPT 5.5は明確な計画で感銘を与えましたが、30ドルのプランで2時間で使用量の85%を消費してしまいました。

構造化ワークフローがAI DESベンチマークで計画モードとスーパーパワーを凌駕
OuroborosワークフローがAI支援離散イベントシミュレーションベンチマークで1位を獲得。Claudeのプランモードやfat-skillスーパーパワーアプローチを上回り、構造化された明確化→計画→実行→評価→回復→反復のサイクルを活用。

Claudeはピーク時間外の使用制限を2週間の間、2倍にします。
Anthropicは、すべてのプランにおいてピーク時間外のClaude利用制限を一時的に2倍にしています。平日の太平洋時間午前5時から11時/グリニッジ標準時午後12時から6時以外は2倍の利用が可能で、週末は終日2倍の利用が可能です。

ローカルLLMベンチマーク:関数呼び出しによるバックエンド生成 – GLM、Qwen、DeepSeekの比較
関数呼び出しによるバックエンドコード生成におけるローカルLLMとフロンティアLLMの厳格なベンチマークと採点基準。主な発見: qwen3.5-35b-a3bはDB/API設計でgpt-5.4に匹敵し、高密度Qwen 27Bは397B MoEを上回る。フロンティアモデルはコストのため除外。