AWS Bedrock réduit silencieusement le quota de Claude Opus 4.7 : un avertissement pour les workflows IA en production

Un utilisateur de Hacker News rapporte que son accès au modèle Claude Opus 4.7 a été soudainement révoqué sur Amazon Bedrock, le quota TPM étant silencieusement passé à 0. L'utilisateur, qui dépend de ce modèle pour des workflows de production au service de clients gouvernementaux, a rencontré des erreurs de limitation avant d'obtenir une explication du support AWS.
Selon la réponse du support, la baisse de quota est due à une « récente mise à jour système » qui a ajusté les contrôles d'accès en fonction de facteurs incluant les considérations régionales, l'historique de paiement et les schémas d'utilisation. Les quotas ont été fixés à 0 à partir du 1er mai 2026, et AWS déclare explicitement que le rétablissement « ne peut garantir son approbation ». La solution de contournement recommandée : migrer vers Claude Opus 4.6, pour lequel l'utilisateur dispose de quotas de 10 000 requêtes/min et 3 000 000 tokens/min dans us-east-1 (avec des variantes interrégionales et globales). Le message de support note qu'Opus 4.6 « peut servir de remplacement efficace avec un minimum de modifications de code ».
Les commentateurs de HN expriment leur frustration. L'utilisateur DetroitThrow qualifie cela d'« insensé de la part d'une entreprise de faire un tel coup à des clients payants avec des workflows de production » et recommande de passer à Google AI ou à un accès direct à Anthropic. Ils notent que Bedrock a un historique de limitations aléatoires, citant la couverture précédente de Quinnypig sur les retraits de support entreprise. L'auteur original confirme qu'il « ne peut même plus faire une seule requête ».
Cet incident souligne le risque de dépendre d'AWS Bedrock pour l'inférence IA en production, en particulier avec des modèles frontières où l'accès peut être révoqué sans préavis. Les développeurs exécutant des charges de travail critiques sur Bedrock devraient envisager des bascules multi-fournisseurs ou des contrats API directs avec des fournisseurs de modèles comme Anthropic.
📖 Lire la source complète : HN AI Agents
👀 See Also

Notes de version de Claude Desktop 1.1.4498 : Rebond du Dock, Extension de l'environnement Shell et Prise en charge du Cloud Gouvernemental
Claude Desktop 1.1.4498 ajoute des notifications de rebond dans le dock pour attirer l'attention de l'utilisateur, étend l'extraction de l'environnement shell pour inclure des variables spécifiques à Claude, et introduit la détection des déploiements gouvernementaux/personnalisés. La mise à jour réduit également le délai d'expiration des appels d'outils du pont Chrome de 120 à 10 secondes.

L'analyse de Goldman Sachs montre un impact minimal de l'IA sur la croissance du PIB américain en 2025.
Les économistes de Goldman Sachs rapportent que l'investissement en IA a contribué 'pratiquement zéro' à la croissance du PIB américain en 2025, citant le matériel importé et les impacts de productivité non mesurés comme facteurs clés.

Claude Code v2.1.51 a modifié la facturation du contexte 1M sans notification
La mise à jour v2.1.51 de Claude Code d'Anthropic a modifié discrètement la facturation pour les fenêtres de contexte de 1 million sur les plans Max. Les tokens de contexte au-delà de 200 000 contournent désormais la capacité d'abonnement et passent directement aux frais d'utilisation supplémentaires, même lorsque le budget d'abonnement reste disponible.

Microsoft met fin au partage des revenus avec OpenAI, impact sur les agents d'IA incertain
Microsoft cessera de partager les revenus avec OpenAI, son principal partenaire en IA, selon un rapport de Bloomberg. Cette décision pourrait affecter la manière dont les développeurs intègrent les agents IA via les services Azure OpenAI.