Opus 4.7 a cassé 40% des prompts ; la solution a été de structurer CLAUDE.md et Skills

Quand Opus 4.7 est sorti en avril, environ 40 % des prompts sur 6 configurations d'entreprises de taille moyenne ont été cassés du jour au lendemain. La consommation de tokens a augmenté, les résultats sont devenus étrangement littéraux — 4.6 comblait les instructions ambiguës, mais 4.7 ne le faisait pas. La solution n'a pas été de réécrire les prompts, mais de prendre enfin au sérieux les fichiers CLAUDE.md et Skill.
Ce qui a cassé et pourquoi
Les prompts écrits pour 4.6 supposaient que le modèle serait indulgent avec des instructions vagues. 4.7 les a interprétés littéralement, produisant des résultats nécessitant 3 à 4 tours pour être corrigés. Les prompts qui ont survécu étaient ceux intégrés dans des fichiers Skill avec des formats de sortie explicites, des limites de longueur et des exemples concrets.
L'approche de reconstruction
Sur les 6 configurations, trois changements structurels ont été apportés :
- Les Skills ont remplacé les prompts autonomes — toute action effectuée plus de 3 fois a reçu un fichier Skill (50 à 200 lignes) avec le public cible, le format de sortie, la longueur et un exemple concret de 2-3 phrases. Les Skills sont chargés à la demande au lieu de gonfler le contexte.
- CLAUDE.md hiérarchique — un fichier global pour l'identité de l'utilisateur, l'entreprise, les règles de ton ; un CLAUDE.md au niveau du projet pour chaque engagement ; des instructions au niveau de la session pour les cas uniques. Le modèle lit dans l'ordre et construit un modèle mental qui persiste entre les sessions.
- Fichiers de mémoire séparés — maintient CLAUDE.md sous 400 lignes ; les connaissances institutionnelles détaillées vivent dans des fichiers séparés auxquels CLAUDE.md fait référence, chargés à la demande.
- Étape de vérification dans les longs Skills — le modèle génère la sortie, vérifie contre une liste de 5 à 7 éléments, puis révise. Ajoute 30 secondes par appel mais réduit le nettoyage en aval d'environ 70 %.
Résultats après 3 semaines
- Le nombre moyen de tours entre le prompt et la sortie acceptable est passé de 3-4 à 1-2.
- L'utilisation de tokens a chuté de 22 % dans l'ensemble des espaces de travail.
- Le taux de « Ce résultat est étrange, je réessaie » est passé d'une fois tous les 4 prompts à une fois tous les 15.
- La prochaine version du modèle devrait maintenant être un net positif, pas un net négatif.
Toujours non résolu : versionner CLAUDE.md
Les fichiers au niveau du projet sont dans git, mais le CLAUDE.md global vit dans l'historique des conversations, ce qui est fragile. Pas encore de mécanisme de retour en arrière.
Modèle mental
Le modèle est le moteur. Les Skills + CLAUDE.md + la mémoire sont la voiture. Construisez la voiture une fois ; chaque nouveau moteur la rend plus rapide.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Dépannage d'OpenClaw : Une méthode de réinitialisation minimaliste
Un utilisateur de Reddit partage une méthode en cinq étapes pour réparer les configurations instables d'OpenClaw en supprimant toutes les compétences, en passant à Claude Sonnet, en effaçant les sessions, en simplifiant SOUL.md et en testant avec des commandes de base.

Claude Code Skills vs. Custom Agents : Un modèle mental basé sur la cohérence des tâches
Un utilisateur de Reddit clarifie la distinction entre les compétences de Claude Code et les agents personnalisés : les compétences exécutent les mêmes étapes à chaque fois, tandis que les agents personnalisés nécessitent un raisonnement et une adaptation. Le post couvre également les sous-agents parallèles, la délégation, les crochets et les blocs de construction.

Trace de la Pile LLM de Bout en Bout : De la Frappe au Jeton Diffusé en Continu
Un ingénieur logiciel a créé un document complet retraçant chaque couche de la pile lors de l'envoi d'une requête à un LLM, couvrant le comptage de tokens côté client, les protocoles réseau, les passerelles API, les classificateurs de sécurité, la tokenisation, le cache KV, le pipeline d'échantillonnage et les mécanismes de streaming.

Guide de l'examen des Fondations des Agents Certifiés Claude - Divergences Identifiées
Un candidat récent à l'examen CCA-F rapporte des écarts significatifs entre le guide officiel de l'examen, l'examen pratique et le contenu réel du test. L'examen réel peut inclure jusqu'à 13 scénarios alors que le guide n'en liste que 6, et l'examen pratique n'en couvre que 4.