Étude Berkeley : Toutes invites IA formalisent la prose

Tom van Nuenen, de Berkeley, a soumis 300 récits personnels à trois modèles de pointe (de type Claude, ChatGPT et Gemini) dans trois conditions de prompt : un générique « améliorez ceci », un générique « réécrivez ceci », et un explicite « révisez ceci en préservant la voix originale ». Il a mesuré 13 marqueurs stylométriques dans les textes d'entrée et de sortie : mots fonctionnels, contractions, pronoms à la première personne, diversité lexicale, variance de longueur des phrases, motifs de ponctuation et mots d'émotion.

Résultat : chaque modèle, dans chaque condition, a dévié dans la même direction. La sortie présentait moins de contractions, moins de pronoms à la première personne, une plus grande diversité lexicale, des mots plus longs et une ponctuation plus élaborée. Le changement a fait passer la prose d'une narration ancrée à une narration distanciée. Le prompt « préserver la voix » n'a réduit que l'ampleur de la dérive, pas sa direction.

En langage clair : toute révision par IA rend la prose plus polie, plus formelle, plus désireuse de plaire — même lorsque le prompt dit le contraire.

Implications pour les outils

L'article soutient que les instructions sur la voix opèrent à un niveau que la distribution post-entraînement du modèle écrase en un ou deux paragraphes. Quiconque peaufine des prompts, des collages d'exemples, des instructions personnalisées ou des bibles de personnages pour une production vocale (écriture, dialogues, textes marketing, essais persuasifs) travaille sur un problème structurellement limité.

Il offre également l'explication empirique la plus claire de la régression stylistique de Claude 4.7 : la voix centrale de 4.7 est plus profondément encodée que celle de 4.6, c'est pourquoi elle lit mieux la structure stylométrique (comme le montre l'expérience de Piper) et résiste davantage aux déviations (les plaintes sur la voix des notes).

Architecture basée sur des contraintes

La recommandation de l'auteur : si vous souhaitez préserver la voix dans un travail de longue haleine, l'architecture doit être extérieure au prompt. Des profils de style compilés doivent être appliqués comme des contraintes impératives à chaque génération — et non comme des paramètres de prompt pouvant être outrepassés. Une analyse détaillée des raisons pour lesquelles chaque outil d'écriture majeur (Sudowrite, NovelCrafter, Claude/ChatGPT direct) rencontre la même limite, et à quoi ressemble une architecture basée sur des contraintes en pratique, est disponible dans le billet de blog ci-dessous.

Article : https://arxiv.org/abs/2604.22142

📖 Lire la source complète : r/ClaudeAI

Étude de Berkeley : Toutes les invites de révision IA font dériver la prose vers la formalité, même « Préserver la voix »

Implications pour les outils

Architecture basée sur des contraintes

👀 See Also

Les développeurs du noyau Linux proposent de supprimer le code obsolète en raison des rapports de bogues générés par des LLM.

Le Test Nocturne de la Griffe Ouverte : Un Bond en Avant dans l'Automatisation de l'IA

Claude Sonnet 4.5 rencontre des erreurs accrues — Mise à jour de statut

Écart de Gouvernance du Comportement des Agents IA Révélé par l'Incident de l'E-mail de Summer Yue