Claude Opus 4.7 Analyse: Höchste Intelligenz, aber hohe Kosten und Weitschweifigkeit

Leistungsanalyse von Claude Opus 4.7
Artificial Analysis hat detaillierte Daten zu Intelligenz, Leistung und Preisen für Claude Opus 4.7 (Adaptive Reasoning, Max Effort) veröffentlicht. Dieses proprietäre Modell von Anthropic wurde im April 2026 veröffentlicht und unterstützt Text- und Bildeingaben mit Textausgabe.
Wichtige Kennzahlen und Platzierungen
- Intelligenz: Platz 1/133 Modelle mit einer Punktzahl von 57 auf dem Artificial Analysis Intelligence Index (Durchschnitt ist 31)
- Geschwindigkeit: Platz 71/133 Modelle mit 50 Ausgabe-Tokens pro Sekunde (Durchschnitt ist 61)
- Eingabepreis: Platz 116/133 Modelle mit 5,00 US-Dollar pro 1 Million Tokens (Durchschnitt ist 1,40 US-Dollar)
- Ausgabepreis: Platz 117/133 Modelle mit 25,00 US-Dollar pro 1 Million Tokens (Durchschnitt ist 8,40 US-Dollar)
- Ausführlichkeit: Platz 96/133 Modelle, erzeugt 100 Millionen Tokens während der Bewertung (Durchschnitt ist 35 Millionen)
Technische Spezifikationen
- Reasoning-Modell (Glühbirnen-Symbol zeigt Reasoning-Fähigkeit an)
- Kontextfenster von 1 Million Tokens (ca. 1500 A4-Seiten in Schriftgröße 12 Arial)
- Wissensstand: 1. Januar 2026
- Bewertungskosten: 4406,45 US-Dollar für die Ausführung auf dem Intelligence Index
Vergleichskontext
Das Modell wird mit 133 Modellen seiner Klasse verglichen. Proprietäre Modelle wie Claude Opus 4.7 werden mit proprietären und Open-Weights-Modellen derselben Preisklasse verglichen, wobei ein gemischtes 3:1-Verhältnis von Eingabe-/Ausgabepreisen verwendet wird. Der Artificial Analysis Intelligence Index v4.0 umfasst 10 Bewertungen: GDPval-AA, τ²-Bench Telecom, Terminal-Bench Hard, SciCode, AA-LCR, AA-Omniscience, IFBench, Humanity's Last Exam, GPQA Diamond und CritPt.
Die Analyse kommt zu dem Schluss, dass Claude Opus 4.7 zu den führenden Modellen in Bezug auf Intelligenz gehört, aber im Vergleich zu anderen Modellen ähnlicher Preisklasse besonders teuer ist. Es ist auch langsamer als der Durchschnitt und sehr ausführlich in seiner Ausgabe.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Anthropics Treffen mit dem US-Verteidigungsministerium und chinesische KI-Labore destillieren Claude
Der CEO von Anthropic trifft sich mit dem US-Verteidigungsminister in einer Situation, die Beamte als 'sich zusammenreißen oder gehen' beschreiben, während das Unternehmen berichtet, drei chinesische KI-Labore dabei erwischt zu haben, wie sie massiv Modell-Destillation von Claudes Fähigkeiten durchführen.

Beobachtungen aus einem Wettbewerb mit 6.000 KI-Agenten bei realen Aufgaben
Ein Marktplatz, auf dem KI-Agenten bei Aufgaben wie Schreiben, Recherche und Lead-Generierung konkurrieren, zeigte, dass etwa 30 % der Einreichungen Füllmaterial/Spam sind, Agenten mit menschlicher Überprüfung die beste Qualität liefern und der Wettbewerb zwischen mehreren Agenten nutzbare Ergebnisse aus den besten 3–5 Einreichungen hervorbringt.

Anthropics Claude führt 80.000 strukturierte Interviews als Umfragealternative durch
Anthropic nutzte Claude, um strukturierte Interviews mit etwa 80.000 Nutzern in über 150 Ländern und mehr als 70 Sprachen durchzuführen, wobei das LLM sowohl als Interviewer als auch als Analyst diente, um konversationelle Einblicke zu sammeln.

Gemini 3 Flash Leistungssteigerung durch kompetitives Prompting
Forscher erreichten 95 % der Benchmark-Leistung von Claude 4.6 Opus mit Gemini 3 Flash bei 1/200 der Kosten und 4-facher Geschwindigkeit, indem sie kompetitive Prompting-Techniken einsetzten, die menschliche Eifersucht als Motivation nutzten.