Opus 4.7 hat 40% der Prompts zerstört; Lösung war die Strukturierung von CLAUDE.md und Skills

✍️ OpenClawRadar📅 Veröffentlicht: 18. Mai 2026🔗 Source
Opus 4.7 hat 40% der Prompts zerstört; Lösung war die Strukturierung von CLAUDE.md und Skills
Ad

Als Opus 4.7 im April veröffentlicht wurde, brachen etwa 40 % der Prompts in sechs Mittelstands-Setups über Nacht. Der Token-Verbrauch stieg, die Ausgaben wurden seltsam wörtlich – 4.6 hatte mehrdeutige Anweisungen noch wohlwollend interpretiert, 4.7 tat dies nicht. Die Lösung bestand nicht darin, Prompts umzuschreiben, sondern endlich CLAUDE.md und Skill-Dateien ernst zu nehmen.

Was kaputt ging und warum

Für 4.6 geschriebene Prompts gingen davon aus, dass das Modell bei vagen Anweisungen großzügig sein würde. 4.7 interpretierte sie wörtlich, was zu Ausgaben führte, die 3–4 Durchläufe zur Korrektur benötigten. Prompts, die überlebten, waren in Skill-Dateien mit expliziten Ausgabeformaten, Längenbegrenzungen und Arbeitsbeispielen eingebettet.

Der Wiederaufbau-Ansatz

In den 6 Setups wurden drei strukturelle Änderungen vorgenommen:

  • Skills ersetzten eigenständige Prompts – alles, was mehr als 3 Mal gemacht wurde, erhielt eine Skill-Datei (50–200 Zeilen) mit Zielgruppe, Ausgabeformat, Länge und einem 2–3 Sätze umfassenden Arbeitsbeispiel. Skills werden bei Bedarf geladen, anstatt den Kontext aufzublähen.
  • Hierarchische CLAUDE.md – eine globale Datei für Benutzeridentität, Unternehmen, Sprachregeln; eine projektbezogene CLAUDE.md pro Engagement; sitzungsbezogene Anweisungen für einmalige Aufgaben. Das Modell liest in der Reihenfolge und baut ein mentales Modell auf, das sitzungsübergreifend Bestand hat.
  • Speicherdateien ausgelagert – CLAUDE.md unter 400 Zeilen gehalten; detailliertes institutionelles Wissen lebt in separaten Dateien, auf die CLAUDE.md verweist und die bei Bedarf geladen werden.
  • Verifikationsschritt in langen Skills – Modell generiert Ausgabe, prüft gegen eine 5–7 Punkte umfassende Checkliste, überarbeitet. Fügt 30 s pro Aufruf hinzu, reduziert aber nachgelagerte Bereinigung um ~70 %.
Ad

Ergebnisse nach 3 Wochen

  • Durchschnittliche Prompts-zu-akzeptabler-Ausgabe sank von 3–4 auf 1–2 Durchläufe.
  • Token-Nutzung sank um 22 % über alle Arbeitsbereiche.
  • Rate „Diese Ausgabe ist seltsam, lass es mich noch einmal versuchen“ sank von einmal pro 4 Prompts auf einmal pro 15.
  • Die nächste Modellveröffentlichung sollte jetzt ein Nettogewinn sein, nicht ein Nettoverlust.

Noch ungelöst: Versionierung von CLAUDE.md

Projektbezogene Dateien liegen in Git, aber die globale CLAUDE.md lebt im Chatverlauf, was anfällig ist. Es gibt noch keinen Rollback-Mechanismus.

Mentales Modell

Das Modell ist der Motor. Skills + CLAUDE.md + Speicher ist das Auto. Baue das Auto einmal; jeder neue Motor macht es schneller.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch