Opus 4.7 : 40% des prompts cassés, solution Skills

Quand Opus 4.7 est sorti en avril, environ 40 % des prompts sur 6 configurations d'entreprises de taille moyenne ont été cassés du jour au lendemain. La consommation de tokens a augmenté, les résultats sont devenus étrangement littéraux — 4.6 comblait les instructions ambiguës, mais 4.7 ne le faisait pas. La solution n'a pas été de réécrire les prompts, mais de prendre enfin au sérieux les fichiers CLAUDE.md et Skill.

Ce qui a cassé et pourquoi

Les prompts écrits pour 4.6 supposaient que le modèle serait indulgent avec des instructions vagues. 4.7 les a interprétés littéralement, produisant des résultats nécessitant 3 à 4 tours pour être corrigés. Les prompts qui ont survécu étaient ceux intégrés dans des fichiers Skill avec des formats de sortie explicites, des limites de longueur et des exemples concrets.

L'approche de reconstruction

Sur les 6 configurations, trois changements structurels ont été apportés :

Les Skills ont remplacé les prompts autonomes — toute action effectuée plus de 3 fois a reçu un fichier Skill (50 à 200 lignes) avec le public cible, le format de sortie, la longueur et un exemple concret de 2-3 phrases. Les Skills sont chargés à la demande au lieu de gonfler le contexte.
CLAUDE.md hiérarchique — un fichier global pour l'identité de l'utilisateur, l'entreprise, les règles de ton ; un CLAUDE.md au niveau du projet pour chaque engagement ; des instructions au niveau de la session pour les cas uniques. Le modèle lit dans l'ordre et construit un modèle mental qui persiste entre les sessions.
Fichiers de mémoire séparés — maintient CLAUDE.md sous 400 lignes ; les connaissances institutionnelles détaillées vivent dans des fichiers séparés auxquels CLAUDE.md fait référence, chargés à la demande.
Étape de vérification dans les longs Skills — le modèle génère la sortie, vérifie contre une liste de 5 à 7 éléments, puis révise. Ajoute 30 secondes par appel mais réduit le nettoyage en aval d'environ 70 %.

Résultats après 3 semaines

Le nombre moyen de tours entre le prompt et la sortie acceptable est passé de 3-4 à 1-2.
L'utilisation de tokens a chuté de 22 % dans l'ensemble des espaces de travail.
Le taux de « Ce résultat est étrange, je réessaie » est passé d'une fois tous les 4 prompts à une fois tous les 15.
La prochaine version du modèle devrait maintenant être un net positif, pas un net négatif.

Toujours non résolu : versionner CLAUDE.md

Les fichiers au niveau du projet sont dans git, mais le CLAUDE.md global vit dans l'historique des conversations, ce qui est fragile. Pas encore de mécanisme de retour en arrière.

Modèle mental

Le modèle est le moteur. Les Skills + CLAUDE.md + la mémoire sont la voiture. Construisez la voiture une fois ; chaque nouveau moteur la rend plus rapide.

📖 Lire la source complète : r/ClaudeAI

Opus 4.7 a cassé 40% des prompts ; la solution a été de structurer CLAUDE.md et Skills

Ce qui a cassé et pourquoi

L'approche de reconstruction

Résultats après 3 semaines

Toujours non résolu : versionner CLAUDE.md

Modèle mental

👀 See Also

Optimisation de Qwen3.5-9B sur RTX 3070 Mobile avec ik_llama.cpp : Réglages de configuration et Benchmarks

Optimisation de Qwen 3.6 27B/35B sur RTX 3090 : Flags, Quantification et Routage Automatique

Déboguer les Timeouts du Modèle Local OpenClaw + Ollama : Cinq Correctifs pour les Pannes Silencieuses

7 façons dont les nouveaux ingénieurs peuvent prospérer avec l'IA : maîtriser les fondamentaux, collaborer avec l'IA, construire des projets complets