AWS Bedrock révoque quota Claude Opus 4.7: que faire

Un utilisateur de Hacker News rapporte que son accès au modèle Claude Opus 4.7 a été soudainement révoqué sur Amazon Bedrock, le quota TPM étant silencieusement passé à 0. L'utilisateur, qui dépend de ce modèle pour des workflows de production au service de clients gouvernementaux, a rencontré des erreurs de limitation avant d'obtenir une explication du support AWS.

Selon la réponse du support, la baisse de quota est due à une « récente mise à jour système » qui a ajusté les contrôles d'accès en fonction de facteurs incluant les considérations régionales, l'historique de paiement et les schémas d'utilisation. Les quotas ont été fixés à 0 à partir du 1er mai 2026, et AWS déclare explicitement que le rétablissement « ne peut garantir son approbation ». La solution de contournement recommandée : migrer vers Claude Opus 4.6, pour lequel l'utilisateur dispose de quotas de 10 000 requêtes/min et 3 000 000 tokens/min dans us-east-1 (avec des variantes interrégionales et globales). Le message de support note qu'Opus 4.6 « peut servir de remplacement efficace avec un minimum de modifications de code ».

Les commentateurs de HN expriment leur frustration. L'utilisateur DetroitThrow qualifie cela d'« insensé de la part d'une entreprise de faire un tel coup à des clients payants avec des workflows de production » et recommande de passer à Google AI ou à un accès direct à Anthropic. Ils notent que Bedrock a un historique de limitations aléatoires, citant la couverture précédente de Quinnypig sur les retraits de support entreprise. L'auteur original confirme qu'il « ne peut même plus faire une seule requête ».

Cet incident souligne le risque de dépendre d'AWS Bedrock pour l'inférence IA en production, en particulier avec des modèles frontières où l'accès peut être révoqué sans préavis. Les développeurs exécutant des charges de travail critiques sur Bedrock devraient envisager des bascules multi-fournisseurs ou des contrats API directs avec des fournisseurs de modèles comme Anthropic.

📖 Lire la source complète : HN AI Agents

AWS Bedrock réduit silencieusement le quota de Claude Opus 4.7 : un avertissement pour les workflows IA en production

👀 See Also

Pourquoi un développeur laisse des balises de co-auteur IA dans les commits

Discussion sur Reddit concernant les risques à long terme de la dépendance aux agents de codage

Analyse de l'invite système forcée de ~12K tokens de Claude Code révélant des règles de priorité outrepassant la configuration utilisateur

Critique de la frontière d'abstraction et de l'approche d'intégration des services du MCP