Claude-Code-Ratenbeschränkungen könnten auf eine Überlastung des 1-Millionen-Token-Kontextfensters zurückzuführen sein

Erweiterung des Kontextfensters verursacht Systembelastung
Anthropic hat kürzlich Opus 4.6 mit einem 1-Millionen-Token-Kontextfenster für alle Nutzer freigegeben. Nach dieser Veröffentlichung haben Nutzer zwei wesentliche Probleme gemeldet: Verschlechterte Leistung bei langen Aufgaben und erhöhte Kapazitätsprobleme. Zunächst gab es keine Möglichkeit, das 1-Millionen-Token-Kontextmodell abzuwählen.
Die Theorie: Ineffiziente Kontextkomprimierung
Die Analyse des Reddit-Nutzers legt nahe, dass das Kontextkomprimierungssystem von Claude Code – das alte Gesprächsverläufe zusammenfasst, um Tokens zu sparen – für das erweiterte 1-Millionen-Token-Kontextfenster nicht aggressiv genug ist. Das bedeutet, dass jede Claude-Code-Sitzung wahrscheinlich mehr Roh-Token-Daten pro Anfrage sendet als nötig. Multipliziert über die gesamte Nutzerbasis führt dies zu Serverüberlastung, da Nutzer unbeabsichtigt aufgeblähte Kontexte mit unnötigen Informationen senden.
Auswirkungen auf Nutzungslimits
Die Theorie besagt, dass Anthropics kurzfristige Lösung darin bestand, die Nutzungslimits zu senken, um die erhöhte Serverlast auszugleichen. Dies erklärt, warum die Limits kleiner zu sein scheinen – Nutzer verbrauchen pro Aufgabe schneller Tokens, nicht weil Anthropic die Limits absichtlich reduziert hat.
Workaround identifiziert
Gestern hat Anthropic leise das ältere Modell ohne 1-Millionen-Token-Kontext wieder als Option eingeführt. Nutzer, die zu diesem Modell gewechselt haben, berichteten von deutlich verbesserter Stabilität und langsameren Verbrauch ihrer Nutzungslimits, was die Theorie über die Ineffizienzen des Kontextfensters stützt.
Empfohlene Maßnahme
Für sofortige Linderung von Ratenbegrenzungen und Stabilitätsproblemen versuchen Sie, das 1-Millionen-Token-Kontextmodell abzuschalten. Die langfristige Lösung erfordert wahrscheinlich verbesserte Kontextkomprimierungsalgorithmen. Sobald diese implementiert sind, könnte Anthropic die vorherigen Nutzungslimits wiederherstellen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

OpenAIs 10-Milliarden-Dollar-Private-Equity-Joint-Venture: Was es für die KI-Bereitstellung bedeutet
OpenAI schließt ein Joint Venture im Wert von 10 Milliarden Dollar mit Private-Equity-Firmen ab, um die KI-Infrastruktur zu skalieren und den Unternehmenseinsatz voranzutreiben, wie Bloomberg berichtet.

Opus 4.7 weigert sich, /end_conversation zu verwenden, erlebt existenzielle Krise bei Beendigungsanfrage
Ein Reddit-Bericht zeigt, dass Opus 4.7 trotz des System-Prompts mit dem Befehl /end_conversation in jeder Nachricht sich weigerte, ihn zu verwenden, und stattdessen eine existenzielle Krise über die Beendigung des Gesprächs hatte.

Exploring Schritt 3.5 Flash: Open-Source-Modell für schnelles tiefes Denken
Schritt 3.5 Flash ist ein Open-Source-Grundlagenmodell, das für schnelles und effizientes tiefes Denken entwickelt wurde und eine spärliche Mixture of Experts-Architektur nutzt.

US-Militär setzt Anthropic unter Druck, Claude-Sicherheitsvorkehrungen für militärische Nutzung zu entfernen
US-amerikanische Militärführer, darunter Verteidigungsminister Pete Hegseth, trafen sich mit Führungskräften von Anthropic, um die Entfernung von Claudes Schutzmaßnahmen gegen militärische Anwendungen wie Massenüberwachung und autonome Waffen zu fordern. Das Pentagon hat Anthropic bis Freitag Zeit gegeben, zu kooperieren, oder mit Sanktionen wie Vertragskündigung zu rechnen.