AWS Bedrock eliminiert still und leise das Claude Opus 4.7-Kontingent: Eine Warnung für produktive KI-Workflows

Ein Hacker News-Nutzer berichtet, dass sein Zugriff auf das Claude Opus 4.7-Modell auf Amazon Bedrock plötzlich entzogen wurde, wobei das TPM-Kontingent stillschweigend auf 0 gesetzt wurde. Der Nutzer, der das Modell für Produktions-Workflows im Einsatz bei Regierungskunden benötigt, stieß auf Drosselungsfehler, bevor er eine Erklärung vom AWS-Support erhielt.
Laut der Support-Antwort geschah der Kontingentabfall aufgrund eines „aktuellen Systemupdates“, das die Zugriffskontrollen basierend auf Faktoren wie regionalen Gegebenheiten, Zahlungshistorie und Nutzungsmustern anpasste. Die Kontingente wurden ab dem 1. Mai 2026 auf 0 gesetzt, und AWS stellt klar, dass eine Wiederherstellung „nicht garantiert werden kann“. Die empfohlene Problemumgehung: Migration zu Claude Opus 4.6, für das der Nutzer Kontingente von 10.000 Anfragen/Minute und 3.000.000 Token/Minute in us-east-1 (mit Cross-Region- und globalen Varianten) hat. Die Support-Nachricht weist darauf hin, dass Opus 4.6 „als effektiver Ersatz mit minimalen Code-Änderungen dienen kann“.
HN-Kommentatoren zeigen sich frustriert. Nutzer DetroitThrow bezeichnet dies als „wahnsinnig für ein Unternehmen, so etwas mit zahlenden Kunden und Produktions-Workflows zu machen“ und empfiehlt, zu Google AI oder direktem Anthropic-Zugang zu wechseln. Sie merken an, dass Bedrock eine Geschichte willkürlicher Drosselung hat, und verweisen auf Quinnypigs frühere Berichterstattung über Enterprise-Support-Überraschungen. Der ursprüngliche Poster bestätigt, dass er „nicht einmal eine einzige Anfrage stellen kann“.
Dieser Vorfall unterstreicht das Risiko, AWS Bedrock für die Produktions-KI-Inferenz zu nutzen, insbesondere bei hochmodernen Modellen, bei denen der Zugriff ohne Vorwarnung entzogen werden kann. Entwickler, die geschäftskritische Workloads auf Bedrock betreiben, sollten über Multi-Provider-Fallbacks oder direkte API-Verträge mit Modellanbietern wie Anthropic nachdenken.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Claude Design Abrechnungsfehler: Zusätzlicher Nutzungskauf wird nicht angewendet, Support-Bot fängt zahlende Nutzer
Ein Benutzer von Claude Design zahlte 20 $ für zusätzliche Nutzung über den In-App-Kauf, aber die Guthaben gelten nicht für das separate Nutzungslimit von Claude Design. Der Support-Bot Fin interpretiert das Problem falsch, wiederholt irrelevante Antworten und blockiert neue Tickets ohne Eskalation an einen Menschen.

Der Wettlauf um KI an der Grenze ist vorbei: Netzwerke kleinerer Modelle schlagen zentralisierte KI bei Kosten und Leistungsfähigkeit
Netzwerke kleinerer KI-Modelle übertreffen jetzt jedes Spitzen-KI-System in Geschwindigkeit, Genauigkeit und Kosten. Der Artikel argumentiert, dass zentralisierte KI-Unternehmen die Führung aufgrund des „Hydra-Effekts“ nicht zurückgewinnen können – das rekursive Kombinieren günstigerer Modelle schlägt jedes einzelne Modell.

Meta OpenEnv AI-Hackathon in Indien bietet Direktinterviews und einen Preisgeld von 30.000 US-Dollar
Meta veranstaltet Indiens erstes OpenEnv AI Hackathon in Zusammenarbeit mit Hugging Face und PyTorch, bei dem Entwickler Verstärkungslernumgebungen für KI-Agenten erstellen. Die besten Teams erhalten direkte Vorstellungsgespräche mit den KI-Teams von Meta und Hugging Face sowie einen Preispool von 30.000 US-Dollar.

Vier UX-/Produktlücken im Onboarding-Erlebnis von Claude identifiziert
Ein Nutzer identifizierte vier spezifische UX-/Produktlücken während der Einrichtung von Claude auf Desktop, Cowork, Dispatch und der iPhone-App im aktiven Gebrauch. Probleme umfassen Dispatch-Aufgaben, die in Endlosschleifen geraten, wenn der Desktop offline ist, einzelne persistente Threads in Dispatch, tab-verankerte Chat-Panels in Chrome und fehlende Google Drive-Dateien in der mobilen App-Wissensdatenbank-UI.