Microsoft cancela licenças do Claude Code — Agentes de IA são caros demais para escalar

A Microsoft está cancelando a maioria das licenças diretas do Claude Code para uso interno, realocando engenheiros de volta para o GitHub Copilot CLI, segundo The Verge. A reversão ocorre seis meses após a empresa abrir acesso ao Claude Code, incentivando milhares de desenvolvedores, gerentes de produto e designers a experimentar a ferramenta de codificação agente. Ela se tornou popular demais — e cara demais.
Detalhes Principais
- O acordo Foundry da Microsoft com a Anthropic (investimento de US$ 5 bilhões, compromisso de computação Azure de US$ 30 bilhões) não é afetado. Apenas as licenças diretas internas do Claude Code estão sendo cortadas.
- O CTO da Uber, Praveen Neppalli Naga, disse ao The Information em abril que a empresa já havia queimado todo o seu orçamento de ferramentas de codificação de IA de 2026 em apenas quatro meses, após incentivar a adoção por meio de rankings internos.
- A Meta possui um ranking chamado "Claudeonomics" que monitora o uso de tokens de IA por funcionário. A Amazon promove "toxenmaxx" — maximizar o consumo de tokens.
- O Goldman Sachs prevê que a IA agente pode impulsionar um aumento de 24 vezes no consumo de tokens até 2030, chegando a 120 quatrilhões de tokens por mês.
- A Gartner prevê que o custo de inferência para um LLM de 1 trilhão de parâmetros cairá cerca de 90% até 2030 em comparação com 2025, mas o gasto total das empresas com IA ainda aumentará porque os modelos agentes exigem muito mais tokens por tarefa, e os provedores de IA não repassarão totalmente a redução de custos aos clientes.
O vice-presidente da Nvidia, Bryan Catanzaro, resumiu: "Para minha equipe, o custo da computação é muito superior aos custos dos funcionários."
Conclusão
A economia dos agentes de IA está invertida: tokens mais baratos não significam contas mais baratas. Como a Microsoft e a Uber estão descobrindo, o consumo de tokens supera as quedas de preço quando os agentes são implantados em escala. Se você está fazendo orçamento para ferramentas de IA em 2026, planeje custos 3 a 5 vezes maiores que a linha de base — a menos que os provedores mudem para planos de preço fixo ou com limite de uso.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Líder Sênior de IA do Governo Desconhece LLMs Locais: Relato de um Desenvolvedor
Um desenvolvedor de LLM local relata que um líder sênior de IA do governo não sabia por que empresas escolheriam LLMs locais em vez de APIs em nuvem, apesar de entender os conceitos técnicos básicos.

Comparação de Benchmark dos Modelos Qwen 3.5 com os Principais Modelos de IA
Um site de comparação de benchmarks inclui pontuações verificadas e infográficos comparativos para os modelos Qwen 3.5 (122B, 35B, 27B, 397B) contra modelos como GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro e outros.

A Análise de Preços de Inferência Revela Variação de 4,4x para o Mesmo Modelo entre Provedores
Análise dos preços de inferência para o Llama 3.1 70B Instruct mostra uma diferença de custo de 4,4x entre provedores, com DeepInfra a US$ 0,20/US$ 0,27 por milhão de tokens e Together a US$ 0,88/US$ 0,88. Para modelos de raciocínio, a variação chega a ~30x entre DeepSeek R1 e OpenAI o1.

Roteiristas de Hollywood se voltam para treinamento de IA: relato em primeira pessoa sobre trabalho de anotação de dados
Um showrunner de Hollywood descreve a transição para o trabalho de treinamento de IA a $52/hora após a greve de 2023, anotando conversas, imagens e vídeos para empresas como Mercor e Outlier.