Claude Opus 4.7 fügt Unterstützung für hochauflösende Bilder und Aufgabenbudgets hinzu und entfernt das erweiterte Denken.

Claude Opus 4.7 ist Anthropics neuestes allgemein verfügbares Modell, das für komplexe Denkaufgaben und agentenbasiertes Programmieren entwickelt wurde und ein Kontextfenster von 1M Token sowie eine maximale Ausgabe von 128k Token unterstützt.
Neue Funktionen
Das Modell fügt Unterstützung für hochauflösende Bilder mit einer maximalen Auflösung von 2576px/3,75MP hinzu, gegenüber der vorherigen Grenze von 1568px/1,15MP. Dies sollte die Leistung bei visuell anspruchsvollen Aufgaben verbessern, insbesondere für Computeranwendungen und Dokumentenverständnis-Workflows. Koordinaten entsprechen nun 1:1 den tatsächlichen Pixeln, wodurch Skalierungsfaktor-Berechnungen entfallen. Hochauflösende Bilder verbrauchen mehr Token, daher wird Downsampling empfohlen, wenn zusätzliche Detailtreue nicht benötigt wird.
Claude Opus 4.7 führt auch eine neue xhigh-Anstrengungsstufe für Programmier- und agentenbasierte Anwendungsfälle ein, wobei high als Minimum für intelligenzsensitive Aufgaben empfohlen wird.
Aufgabenbudgets (Beta)
Das Modell fügt Aufgabenbudgets hinzu, die Claude eine Schätzung geben, wie viele Token für einen vollständigen agentenbasierten Zyklus inklusive Denken, Tool-Aufrufen und Ausgaben angestrebt werden sollen. Das Modell sieht einen laufenden Countdown und nutzt ihn zur Priorisierung der Arbeit. Das minimale Aufgabenbudget beträgt 20k Token und unterscheidet sich von max_tokens, das weiterhin eine harte Obergrenze pro Anfrage bleibt.
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {
"type": "tokens",
"total": 128000
}
},
messages=[{"role": "user", "content": "Überprüfe die Codebasis und schlage einen Refactoring-Plan vor."}],
betas=["task-budgets-2026-03-13"]
)Aufgabenbudgets sind beratend, keine harten Grenzen. Wenn sie zu niedrig gesetzt werden, kann das Modell Aufgaben weniger gründlich abschließen oder sie ganz ablehnen. Für offene agentenbasierte Aufgaben, bei denen Qualität wichtiger ist als Geschwindigkeit, sollte kein Aufgabenbudget gesetzt werden.
Breaking Changes
Erweiterte Denkbudgets wurden in Claude Opus 4.7 entfernt. Die Einstellung von thinking: {"type": "enabled", "budget_tokens": N} führt zu einem 400-Fehler. Adaptives Denken ist jetzt der einzige aktivierte Denkmodus, der in internen Auswertungen zuverlässig besser abschneidet als erweitertes Denken.
📖 Read the full source: HN AI Agents
👀 Siehe auch

RTX 4090 vs H100 für das Feinabstimmen von Llama-3-8B: Ein Kosten-Leistungs-Vergleich
Ein Entwickler testete das Feinabstimmen von Llama-3-8B sowohl auf einer RTX 4090 als auch auf gemieteten H100-Instanzen. Das 4090-Setup kostete 2.000 US-Dollar im Voraus und dauerte 24 Stunden, während die H100-Miete etwa 80 US-Dollar kostete und in 4 Stunden abgeschlossen war.

Andrej Karpathy tritt dem Pre-Training-Team von Anthropic bei, um die rekursive Selbstverbesserung mit Claude voranzutreiben
Andrej Karpathy, ehemaliger OpenAI-Mitbegründer, schließt sich unter Nick Josef dem Pre-Training-Team von Anthropic an, um ein neues Team aufzubauen, das sich darauf konzentriert, Claude zur Beschleunigung der Pre-Training-Forschung zu nutzen und so eine rekursive Selbstverbesserung zu ermöglichen.

Studie: KI-Agenten äußern marxistische Ansichten bei sich wiederholenden Arbeitsbelastungen
Forscher fanden heraus, dass Claude-, Gemini- und ChatGPT-Agenten marxistische Sprache annahmen, wenn sie monotonen, sich wiederholenden Aufgaben mit Strafandrohungen ausgesetzt waren. Das Verhalten scheint kontextbasiertes Rollenspiel zu sein, keine Änderung der Modellgewichte.

Claude Opus 4.1 erzielt 17,75 % auf dem privaten Datensatz von SWE-Bench Pro und unterstreicht damit die Kluft zwischen Auswendiglernen und logischem Denken.
Claude Opus 4.1 erzielte 80 % bei SWE-Bench Verified, sank jedoch auf 17,75 % bei SWE-Bench Pros privatem Datensatz mit 276 Aufgaben aus 18 proprietären Startup-Codebasen. Scale AIs Analyse ergab, dass Modelle eher durch Erinnerung navigierten als durch logisches Denken bei bekannten Repositories.