AWS Bedrock setzt Claude Opus 4.7-Kontingent auf 0: Umstieg auf 4.6 nötig

Ein Hacker News-Nutzer berichtet, dass sein Zugriff auf das Claude Opus 4.7-Modell auf Amazon Bedrock plötzlich entzogen wurde, wobei das TPM-Kontingent stillschweigend auf 0 gesetzt wurde. Der Nutzer, der das Modell für Produktions-Workflows im Einsatz bei Regierungskunden benötigt, stieß auf Drosselungsfehler, bevor er eine Erklärung vom AWS-Support erhielt.

Laut der Support-Antwort geschah der Kontingentabfall aufgrund eines „aktuellen Systemupdates“, das die Zugriffskontrollen basierend auf Faktoren wie regionalen Gegebenheiten, Zahlungshistorie und Nutzungsmustern anpasste. Die Kontingente wurden ab dem 1. Mai 2026 auf 0 gesetzt, und AWS stellt klar, dass eine Wiederherstellung „nicht garantiert werden kann“. Die empfohlene Problemumgehung: Migration zu Claude Opus 4.6, für das der Nutzer Kontingente von 10.000 Anfragen/Minute und 3.000.000 Token/Minute in us-east-1 (mit Cross-Region- und globalen Varianten) hat. Die Support-Nachricht weist darauf hin, dass Opus 4.6 „als effektiver Ersatz mit minimalen Code-Änderungen dienen kann“.

HN-Kommentatoren zeigen sich frustriert. Nutzer DetroitThrow bezeichnet dies als „wahnsinnig für ein Unternehmen, so etwas mit zahlenden Kunden und Produktions-Workflows zu machen“ und empfiehlt, zu Google AI oder direktem Anthropic-Zugang zu wechseln. Sie merken an, dass Bedrock eine Geschichte willkürlicher Drosselung hat, und verweisen auf Quinnypigs frühere Berichterstattung über Enterprise-Support-Überraschungen. Der ursprüngliche Poster bestätigt, dass er „nicht einmal eine einzige Anfrage stellen kann“.

Dieser Vorfall unterstreicht das Risiko, AWS Bedrock für die Produktions-KI-Inferenz zu nutzen, insbesondere bei hochmodernen Modellen, bei denen der Zugriff ohne Vorwarnung entzogen werden kann. Entwickler, die geschäftskritische Workloads auf Bedrock betreiben, sollten über Multi-Provider-Fallbacks oder direkte API-Verträge mit Modellanbietern wie Anthropic nachdenken.

📖 Read the full source: HN AI Agents

AWS Bedrock eliminiert still und leise das Claude Opus 4.7-Kontingent: Eine Warnung für produktive KI-Workflows

👀 Siehe auch

Claude Design Abrechnungsfehler: Zusätzlicher Nutzungskauf wird nicht angewendet, Support-Bot fängt zahlende Nutzer

Der Wettlauf um KI an der Grenze ist vorbei: Netzwerke kleinerer Modelle schlagen zentralisierte KI bei Kosten und Leistungsfähigkeit

Meta OpenEnv AI-Hackathon in Indien bietet Direktinterviews und einen Preisgeld von 30.000 US-Dollar

Vier UX-/Produktlücken im Onboarding-Erlebnis von Claude identifiziert