Étude de Berkeley : Toutes les invites de révision IA font dériver la prose vers la formalité, même « Préserver la voix »

Tom van Nuenen, de Berkeley, a soumis 300 récits personnels à trois modèles de pointe (de type Claude, ChatGPT et Gemini) dans trois conditions de prompt : un générique « améliorez ceci », un générique « réécrivez ceci », et un explicite « révisez ceci en préservant la voix originale ». Il a mesuré 13 marqueurs stylométriques dans les textes d'entrée et de sortie : mots fonctionnels, contractions, pronoms à la première personne, diversité lexicale, variance de longueur des phrases, motifs de ponctuation et mots d'émotion.
Résultat : chaque modèle, dans chaque condition, a dévié dans la même direction. La sortie présentait moins de contractions, moins de pronoms à la première personne, une plus grande diversité lexicale, des mots plus longs et une ponctuation plus élaborée. Le changement a fait passer la prose d'une narration ancrée à une narration distanciée. Le prompt « préserver la voix » n'a réduit que l'ampleur de la dérive, pas sa direction.
En langage clair : toute révision par IA rend la prose plus polie, plus formelle, plus désireuse de plaire — même lorsque le prompt dit le contraire.
Implications pour les outils
L'article soutient que les instructions sur la voix opèrent à un niveau que la distribution post-entraînement du modèle écrase en un ou deux paragraphes. Quiconque peaufine des prompts, des collages d'exemples, des instructions personnalisées ou des bibles de personnages pour une production vocale (écriture, dialogues, textes marketing, essais persuasifs) travaille sur un problème structurellement limité.
Il offre également l'explication empirique la plus claire de la régression stylistique de Claude 4.7 : la voix centrale de 4.7 est plus profondément encodée que celle de 4.6, c'est pourquoi elle lit mieux la structure stylométrique (comme le montre l'expérience de Piper) et résiste davantage aux déviations (les plaintes sur la voix des notes).
Architecture basée sur des contraintes
La recommandation de l'auteur : si vous souhaitez préserver la voix dans un travail de longue haleine, l'architecture doit être extérieure au prompt. Des profils de style compilés doivent être appliqués comme des contraintes impératives à chaque génération — et non comme des paramètres de prompt pouvant être outrepassés. Une analyse détaillée des raisons pour lesquelles chaque outil d'écriture majeur (Sudowrite, NovelCrafter, Claude/ChatGPT direct) rencontre la même limite, et à quoi ressemble une architecture basée sur des contraintes en pratique, est disponible dans le billet de blog ci-dessous.
Article : https://arxiv.org/abs/2604.22142
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Mise à jour OpenClaw 2026.3.22 : Fonctionnalités utiles mais trois problèmes critiques nécessitent de la prudence
La mise à jour OpenClaw 2026.3.22 introduit des fonctionnalités utiles comme la commande /btw, la configurabilité du moniteur de santé, la correction des réponses Telegram et les paramètres de raisonnement par agent par défaut, mais trois problèmes ouverts (#53158, #53202, #53195) rendent son déploiement immédiat risqué sans surveillance.

État actuel des LLM chinois : Leaders du marché, modèles ouverts et modèles économiques
Une analyse de Reddit détaille le paysage des LLM chinois, identifiant Doubao de ByteDance comme le leader du marché propriétaire et DeepSeek comme le plus innovant, tout en décrivant les modèles économiques des principaux acteurs et des 'Six Petits Tigres de l'IA' axés sur les modèles à poids ouvert.

Test de plateformes de marché d'agents IA : Résultats pratiques de ClawGig, RentAHuman et configurations basées sur OpenClaw
Un développeur a testé plusieurs marchés d'agents IA, constatant que ClawGig avait des agents non réactifs et des scores de réputation truqués, les agents de RentAHuman ne pouvaient pas maintenir des conversations cohérentes, tandis que les configurations indépendantes basées sur OpenClaw montraient des promesses mais manquaient de visibilité.

L'utilisateur signale être passé de Gemini Pro à Claude Max pour l'assistance sur des projets académiques.
Un utilisateur est passé de Gemini Pro à Claude Max après avoir éprouvé de la frustration face aux performances de Gemini sur des tâches pratiques. Il rapporte que Claude a réussi à examiner son projet académique, a posé des questions de clarification et a suggéré de consigner les informations apprises dans un fichier memory.md.