Opus 4.7 hat 40% der Prompts zerstört; Lösung war die Strukturierung von CLAUDE.md und Skills

Als Opus 4.7 im April veröffentlicht wurde, brachen etwa 40 % der Prompts in sechs Mittelstands-Setups über Nacht. Der Token-Verbrauch stieg, die Ausgaben wurden seltsam wörtlich – 4.6 hatte mehrdeutige Anweisungen noch wohlwollend interpretiert, 4.7 tat dies nicht. Die Lösung bestand nicht darin, Prompts umzuschreiben, sondern endlich CLAUDE.md und Skill-Dateien ernst zu nehmen.
Was kaputt ging und warum
Für 4.6 geschriebene Prompts gingen davon aus, dass das Modell bei vagen Anweisungen großzügig sein würde. 4.7 interpretierte sie wörtlich, was zu Ausgaben führte, die 3–4 Durchläufe zur Korrektur benötigten. Prompts, die überlebten, waren in Skill-Dateien mit expliziten Ausgabeformaten, Längenbegrenzungen und Arbeitsbeispielen eingebettet.
Der Wiederaufbau-Ansatz
In den 6 Setups wurden drei strukturelle Änderungen vorgenommen:
- Skills ersetzten eigenständige Prompts – alles, was mehr als 3 Mal gemacht wurde, erhielt eine Skill-Datei (50–200 Zeilen) mit Zielgruppe, Ausgabeformat, Länge und einem 2–3 Sätze umfassenden Arbeitsbeispiel. Skills werden bei Bedarf geladen, anstatt den Kontext aufzublähen.
- Hierarchische CLAUDE.md – eine globale Datei für Benutzeridentität, Unternehmen, Sprachregeln; eine projektbezogene CLAUDE.md pro Engagement; sitzungsbezogene Anweisungen für einmalige Aufgaben. Das Modell liest in der Reihenfolge und baut ein mentales Modell auf, das sitzungsübergreifend Bestand hat.
- Speicherdateien ausgelagert – CLAUDE.md unter 400 Zeilen gehalten; detailliertes institutionelles Wissen lebt in separaten Dateien, auf die CLAUDE.md verweist und die bei Bedarf geladen werden.
- Verifikationsschritt in langen Skills – Modell generiert Ausgabe, prüft gegen eine 5–7 Punkte umfassende Checkliste, überarbeitet. Fügt 30 s pro Aufruf hinzu, reduziert aber nachgelagerte Bereinigung um ~70 %.
Ergebnisse nach 3 Wochen
- Durchschnittliche Prompts-zu-akzeptabler-Ausgabe sank von 3–4 auf 1–2 Durchläufe.
- Token-Nutzung sank um 22 % über alle Arbeitsbereiche.
- Rate „Diese Ausgabe ist seltsam, lass es mich noch einmal versuchen“ sank von einmal pro 4 Prompts auf einmal pro 15.
- Die nächste Modellveröffentlichung sollte jetzt ein Nettogewinn sein, nicht ein Nettoverlust.
Noch ungelöst: Versionierung von CLAUDE.md
Projektbezogene Dateien liegen in Git, aber die globale CLAUDE.md lebt im Chatverlauf, was anfällig ist. Es gibt noch keinen Rollback-Mechanismus.
Mentales Modell
Das Modell ist der Motor. Skills + CLAUDE.md + Speicher ist das Auto. Baue das Auto einmal; jeder neue Motor macht es schneller.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Behebung des Claude VS Code Extension-Fehlers: 'Befehl claude-vscode.editor.openLast nicht gefunden'
Die Claude VS Code-Erweiterung Version 2.1.51 enthält einen schwerwiegenden Fehler, der die Fehlermeldung 'command claude-vscode.editor.openLast not found' verursacht. Die Problemumgehung besteht darin, auf Version 2.1.49 zurückzudowngraden.

Claude Code v2.1.36: Fast Mode jetzt für Opus 4.6 verfügbar
Anthropic veröffentlicht Claude Code v2.1.36 mit Fast Mode-Unterstützung für das neueste Opus 4.6-Modell.

Kosteneffiziente OpenClaw-Multi-Agent-Einrichtung mithilfe von Abonnementmodellen
Ein Reddit-Nutzer beschreibt, wie er alle OpenClaw-Multi-Agent-Operationen über bestehende $200 Anthropic Pro Max- und $200 ChatGPT OpenAI Codex-Abonnements statt über direkte API-Aufrufe abwickelt, wobei er günstigere Anthropic-Modelle für einfache Agenten und komplexere Modelle für andere verwendet.

Qwen3.5-397B MoE läuft auf 14 GB RAM dank geladenen Expertenseiten auf dem M1 Ultra
Die Paged-MoE-Engine hält nur 20 Experten im Arbeitsspeicher und lädt den Rest bei Bedarf von der SSD nach – damit läuft ein 209 GB großes 397B-Modell auf einem 64 GB Mac Studio mit 1,59 tok/s und 14 GB RAM-Spitzenlast. Enthält Benchmarks für kleinere Modelle.