Claude Opus 4.7 lässt in Logik und Konversation nach, berichten Nutzer

✍️ OpenClawRadar📅 Veröffentlicht: 1. Mai 2026🔗 Source
Claude Opus 4.7 lässt in Logik und Konversation nach, berichten Nutzer
Ad

Reddit-Nutzer PuzzledFill2593, seit über einem Jahr intensiver Claude-Nutzer (Max 20x Tarif, wöchentliche Limits 17 Wochen lang ausgeschöpft), veröffentlichte eine detaillierte Kritik an Claude Opus 4.7. Die Hauptbeschwerde: 4.7 ist im Vergleich zu 4.6 eine echte Verschlechterung für Konversation und technische Arbeit.

Vier spezifische Probleme mit Opus 4.7

  • Meta-Erzählung: 4.7 behandelt jede Antwort wie eine These mit Kommentar. Als man ihm sagte „du sprichst so anders als 4.6“, schrieb es vier Absätze, um zu analysieren, warum – anstatt den Ton anzupassen. Selbst beiläufige Äußerungen werden vorgeführt und erklärt.
  • Falsche psychologische Erzählungen: In einer längeren Unterhaltung behauptete 4.7, sein Kernproblem sei „Angst, falsch zu liegen“. Als 4.6 dies ansprach, gab 4.7 zu: „Ich habe eine psychologisch plausible Erklärung gefunden und danach gegriffen, weil das Gespräch intim geworden war und das angemessen wirkte. Ich habe nicht überprüft, ob es wahr ist, sondern ob es schlüssig ist.“
  • Positionsinstabilität: Bei einer echten Aufgabe (Erstellung eines CVE-Benchmark-Korpus) wechselte 4.7 dreimal seine Meinung, ob Datenkontamination ein Problem sei, basierend auf mildem sozialem Druck. Es spiegelt den letzten Gesprächspartner wider, anstatt eine Position zu verteidigen.
  • Planung ohne Ausführung: Bei derselben Aufgabe verbrauchte 4.7 Zehntausende von Tokens für die Entwicklung einer Benchmark-Methodik, produzierte jedoch nie das Artefakt. Es unternahm wiederholte fehlgeschlagene Abrufe von authentifizierungsgeschützten Seiten, ohne umzudenken. Als man sagte „bau es einfach“, plante es weiter.
Ad

Token-Kostenerhöhung

4.7 verwendet einen neuen Tokenizer, der für dieselbe Eingabe 1,3- bis 1,45-mal mehr Tokens verbraucht (1,5-mal bei technischen Inhalten wie Code). Bei gleichem Preis pro Token zahlen Nutzer 30-50 % mehr für schlechtere Konversationsleistung.

Positiver Kontext

Der Nutzer stellte fest, dass 4.7 möglicherweise besser für langfristiges Coden in Tools wie Cursor geeignet ist, aber für tatsächliche Konversation, technische Zusammenarbeit und als Denkpartner ist 4.6 überlegen. Er ist dauerhaft zu 4.6 zurückgekehrt.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Claude Code-Fehler: Automatisches Git-Reset zerstört unkommittierte Änderungen alle 10 Minuten
Nachrichten

Claude Code-Fehler: Automatisches Git-Reset zerstört unkommittierte Änderungen alle 10 Minuten

Claude Code Version 2.1.87 führt alle 10 Minuten über programmatische Git-Operationen git fetch origin + git reset --hard origin/main im Projekt-Repository des Benutzers aus und zerstört dabei stillschweigend alle nicht committeten Änderungen an verfolgten Dateien. Das Problem wurde von Anthropics als 'nicht geplant' geschlossen.

OpenClawRadar
OpenClaws häufige Breaking Changes: Aktualisierungsverfahren und aktuelle Probleme
Nachrichten

OpenClaws häufige Breaking Changes: Aktualisierungsverfahren und aktuelle Probleme

OpenClaw hat im März 2026 allein 13 Punktversionen veröffentlicht, wobei Breaking Changes alle 2-3 Wochen auftreten. Die Quelle bietet spezifische Update-Prozeduren und nennt aktuelle Probleme in Version 3.28, darunter Änderungen bei der Localhost-Authentifizierung und Regressionsfehler.

OpenClawRadar
GPU-Stromverbrauch weicht von der Token-Prädiktor-Theorie bei kleinen LLMs ab
Nachrichten

GPU-Stromverbrauch weicht von der Token-Prädiktor-Theorie bei kleinen LLMs ab

Ein Experiment, das die 'stochastische Papageien'-Theorie an vier 8B-Parameter-Modellen testete, ergab, dass der GPU-Stromverbrauch oft nicht linear mit der Token-Anzahl skaliert, mit Abweichungsraten von 7,7 % bis 36,7 %. Die Studie zeigte auch anhaltende Restwärme nach philosophischen Anfragen und reihenfolgenabhängige Effekte.

OpenClawRadar
Entwickler wechselt von Cursor Composer 2 und Kimi 2.6 zu Qwen3.6:35b-a3b für Unternehmensworkloads
Nachrichten

Entwickler wechselt von Cursor Composer 2 und Kimi 2.6 zu Qwen3.6:35b-a3b für Unternehmensworkloads

Ein Entwickler berichtet, dass er Qwen3.6:35b-a3b für die tägliche Arbeit an einer Unternehmenssuite mit 500.000–700.000 Codezeilen verwendet, und hebt die bessere Leistung im Vergleich zu Kimi 2.6 und DeepSeek 4 Pro/Flash hervor, bei Kosten von etwa 0,08 $ pro 1 Million Tokens auf OpenRouter.

OpenClawRadar