Opus 4.7 a cassé 40% des prompts ; la solution a été de structurer CLAUDE.md et Skills

✍️ OpenClawRadar📅 Publié: May 18, 2026🔗 Source
Opus 4.7 a cassé 40% des prompts ; la solution a été de structurer CLAUDE.md et Skills
Ad

Quand Opus 4.7 est sorti en avril, environ 40 % des prompts sur 6 configurations d'entreprises de taille moyenne ont été cassés du jour au lendemain. La consommation de tokens a augmenté, les résultats sont devenus étrangement littéraux — 4.6 comblait les instructions ambiguës, mais 4.7 ne le faisait pas. La solution n'a pas été de réécrire les prompts, mais de prendre enfin au sérieux les fichiers CLAUDE.md et Skill.

Ce qui a cassé et pourquoi

Les prompts écrits pour 4.6 supposaient que le modèle serait indulgent avec des instructions vagues. 4.7 les a interprétés littéralement, produisant des résultats nécessitant 3 à 4 tours pour être corrigés. Les prompts qui ont survécu étaient ceux intégrés dans des fichiers Skill avec des formats de sortie explicites, des limites de longueur et des exemples concrets.

L'approche de reconstruction

Sur les 6 configurations, trois changements structurels ont été apportés :

  • Les Skills ont remplacé les prompts autonomes — toute action effectuée plus de 3 fois a reçu un fichier Skill (50 à 200 lignes) avec le public cible, le format de sortie, la longueur et un exemple concret de 2-3 phrases. Les Skills sont chargés à la demande au lieu de gonfler le contexte.
  • CLAUDE.md hiérarchique — un fichier global pour l'identité de l'utilisateur, l'entreprise, les règles de ton ; un CLAUDE.md au niveau du projet pour chaque engagement ; des instructions au niveau de la session pour les cas uniques. Le modèle lit dans l'ordre et construit un modèle mental qui persiste entre les sessions.
  • Fichiers de mémoire séparés — maintient CLAUDE.md sous 400 lignes ; les connaissances institutionnelles détaillées vivent dans des fichiers séparés auxquels CLAUDE.md fait référence, chargés à la demande.
  • Étape de vérification dans les longs Skills — le modèle génère la sortie, vérifie contre une liste de 5 à 7 éléments, puis révise. Ajoute 30 secondes par appel mais réduit le nettoyage en aval d'environ 70 %.
Ad

Résultats après 3 semaines

  • Le nombre moyen de tours entre le prompt et la sortie acceptable est passé de 3-4 à 1-2.
  • L'utilisation de tokens a chuté de 22 % dans l'ensemble des espaces de travail.
  • Le taux de « Ce résultat est étrange, je réessaie » est passé d'une fois tous les 4 prompts à une fois tous les 15.
  • La prochaine version du modèle devrait maintenant être un net positif, pas un net négatif.

Toujours non résolu : versionner CLAUDE.md

Les fichiers au niveau du projet sont dans git, mais le CLAUDE.md global vit dans l'historique des conversations, ce qui est fragile. Pas encore de mécanisme de retour en arrière.

Modèle mental

Le modèle est le moteur. Les Skills + CLAUDE.md + la mémoire sont la voiture. Construisez la voiture une fois ; chaque nouveau moteur la rend plus rapide.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Dépannage d'OpenClaw : Une méthode de réinitialisation minimaliste
Guides

Dépannage d'OpenClaw : Une méthode de réinitialisation minimaliste

Un utilisateur de Reddit partage une méthode en cinq étapes pour réparer les configurations instables d'OpenClaw en supprimant toutes les compétences, en passant à Claude Sonnet, en effaçant les sessions, en simplifiant SOUL.md et en testant avec des commandes de base.

OpenClawRadar
Claude Code Skills vs. Custom Agents : Un modèle mental basé sur la cohérence des tâches
Guides

Claude Code Skills vs. Custom Agents : Un modèle mental basé sur la cohérence des tâches

Un utilisateur de Reddit clarifie la distinction entre les compétences de Claude Code et les agents personnalisés : les compétences exécutent les mêmes étapes à chaque fois, tandis que les agents personnalisés nécessitent un raisonnement et une adaptation. Le post couvre également les sous-agents parallèles, la délégation, les crochets et les blocs de construction.

OpenClawRadar
Trace de la Pile LLM de Bout en Bout : De la Frappe au Jeton Diffusé en Continu
Guides

Trace de la Pile LLM de Bout en Bout : De la Frappe au Jeton Diffusé en Continu

Un ingénieur logiciel a créé un document complet retraçant chaque couche de la pile lors de l'envoi d'une requête à un LLM, couvrant le comptage de tokens côté client, les protocoles réseau, les passerelles API, les classificateurs de sécurité, la tokenisation, le cache KV, le pipeline d'échantillonnage et les mécanismes de streaming.

OpenClawRadar
Guide de l'examen des Fondations des Agents Certifiés Claude - Divergences Identifiées
Guides

Guide de l'examen des Fondations des Agents Certifiés Claude - Divergences Identifiées

Un candidat récent à l'examen CCA-F rapporte des écarts significatifs entre le guide officiel de l'examen, l'examen pratique et le contenu réel du test. L'examen réel peut inclure jusqu'à 13 scénarios alors que le guide n'en liste que 6, et l'examen pratique n'en couvre que 4.

OpenClawRadar