Anthropic liefert 1-Million-Token-Kontextfenster für Claude Opus ohne Aufpreis aus.

Erweiterung des Kontextfensters für Claude Opus
Anthropic hat das 1-Million-Token-Kontextfenster für Claude Opus an alle Claude Code-Benutzer auf Max-, Team- und Enterprise-Tarifen in Version 2.1.75 ausgeliefert. Zuvor mussten Benutzer zusätzliche Nutzungsgebühren für das 1M-Fenster zahlen, aber es ist jetzt in diesen Tarifen ohne Aufpreis enthalten.
Praktische Auswirkungen
Das Standard-Kontextfenster bleibt bei 200.000 Tokens, wodurch das 1M-Fenster 5-mal größer ist. Diese Kapazität entspricht ungefähr:
- ~750.000 Wörter
- ~75.000 Codezeilen
- Die gesamte Harry-Potter-Serie
- Den vollständigen Quellcode eines mittelgroßen Open-Source-Projekts oder mehrere kleinere (z.B. Express.js + Flask + FastAPI zusammen)
Benutzer berichten, dass dies ihren Arbeitsablauf erheblich verändert. Bei Rechercheaufgaben können sie nun mehr Details in den Kontext einfügen, wie z.B. die Verwendung von exa MCP, um vollständige Webseiten in den Kontext zu laden, anstatt sich auf integrierte Web-Fetch-Zusammenfassungen zu verlassen.
Vorteile und Einschränkungen
Das erweiterte Kontextfenster bedeutet:
- Keine Notwendigkeit, Eingabeaufforderungen für größere Aufgaben, die noch in 1M Tokens passen, zu komprimieren
- Die Möglichkeit, ganze Projekte in den Kontext zu werfen, sodass das Modell alle Dateien und Abhängigkeiten sehen kann, was potenziell Fehler reduziert
Allerdings weist die Quelle darauf hin, dass 1M Tokens nicht 1M Tokens echter Aufmerksamkeit bedeuten. In der Praxis werden nur etwa 50–65 % des Fensters effektiv genutzt, und mehr Kontext bedeutet immer noch eine stärker verdünnte Aufmerksamkeit.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Pentagon setzt Anthropic Freitagsfrist für Aufgabe von KI-Ethikregeln
Das Pentagon hat Anthropic laut einem Politico-Bericht bis Freitag Zeit gegeben, seine KI-Ethikregeln aufzugeben. Der Artikel erhielt 15 Punkte und 3 Kommentare auf Hacker News.

KI-Datenzentren Wasserverbrauch in Kalifornien: Schätzungen aus Physik und KI-Modellen
Eine Analyse des California WaterBlog, die Physik und vier KI-Modelle nutzt, schätzt den Wasserverbrauch von KI-Rechenzentren in Kalifornien auf 2.300–400.000 Acre-Fuß/Jahr, mit einem realistischen Bereich von 32.000–290.000 Acre-Fuß/Jahr – bescheiden im Vergleich zur Landwirtschaft.

Der KI-Operator: Eine neue Rolle für agentische Workflows
Rish Gupta argumentiert, dass AI-Operatoren innerhalb eines Jahres die Schlüsselrolle in Organisationen sein werden, wobei sie technische Fähigkeiten (Python, LLM-APIs, Agent-Frameworks) mit Geschäftsprozessverständnis kombinieren, um repetitive und wirkungsvolle Aufgaben zu automatisieren.

Cerebras veröffentlicht Step-3.5-Flash-REAP-Modelle mit 40 % weniger Speicherbedarf.
Cerebras hat Step-3.5-Flash-REAP-Modelle veröffentlicht, die REAP (Router-weighted Expert Activation Pruning) verwenden, um 196B-Parameter-Modelle auf 121B zu komprimieren, während nahezu identische Leistung erhalten bleibt. Die Modelle funktionieren mit Standard-vLLM und sind für ressourcenbeschränkte Umgebungen optimiert.