Estudo de Berkeley: Todos os prompts de revisão de IA deslocam a prosa para a formalidade, mesmo "Preservar a voz"

Tom van Nuenen, de Berkeley, processou 300 narrativas pessoais através de três modelos de ponta (Claude-class, ChatGPT-class, Gemini-class) sob três condições de prompt: genérico "melhore isto", genérico "reescreva isto" e explicitamente "revise isto preservando a voz original". Ele mediu 13 marcadores estilométricos na entrada e saída: palavras funcionais, contrações, pronomes em primeira pessoa, diversidade vocabular, variância no comprimento das frases, padrões de pontuação e palavras de emoção.
Resultado: todos os modelos, em todas as condições, desviaram na mesma direção. A saída teve menos contrações, menos pronomes em primeira pessoa, maior dispersão vocabular, palavras mais longas e pontuação mais elaborada. A mudança moveu a prosa de uma narrativa imersiva para uma narrativa distanciada. O prompt "preserve a voz" apenas reduziu a magnitude do desvio, não sua direção.
Em linguagem simples: todo prompt de revisão de IA torna a prosa mais educada, mais formal, mais ansiosa para agradar—mesmo quando o prompt diz para não fazer isso.
Implicações para Ferramentas
O artigo argumenta que as instruções de voz estão em uma camada que a distribuição pós-treinamento do modelo substitui em um ou dois parágrafos. Qualquer pessoa iterando sobre prompts, colagens de amostras, instruções personalizadas ou bíblias de personagens para saída com voz (escrita, diálogo, texto de marketing, ensaios persuasivos) tem trabalhado em um problema com um teto estrutural.
Também oferece a explicação empírica mais clara para a regressão de prosa do Claude 4.7: a voz central do 4.7 é mais profundamente codificada que a do 4.6, razão pela qual ele lê melhor a estrutura estilométrica (como visto no experimento Piper) e resiste mais fortemente a desvios (as reclamações sobre a voz de memorando).
Arquitetura Baseada em Restrições
A recomendação do autor: se você deseja preservação de voz em trabalhos longos, a arquitetura deve estar fora do prompt. Perfis de estilo compilados devem ser aplicados como restrições vinculativas em cada geração — não como parâmetros de prompt que podem ser substituídos. Uma análise de por que cada grande ferramenta de escrita (Sudowrite, NovelCrafter, Claude/ChatGPT direto) atinge o mesmo teto, e como é uma arquitetura baseada em restrições na prática, está disponível no post do blog abaixo.
Artigo: https://arxiv.org/abs/2604.22142
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Militares dos EUA pressionam a Anthropic a remover salvaguardas do Claude para uso militar
Líderes militares dos EUA, incluindo o Secretário de Defesa Pete Hegseth, reuniram-se com executivos da Anthropic para exigir a remoção das salvaguardas do Claude contra aplicações militares como vigilância em massa e armas autônomas. O Pentágono deu à Anthropic até sexta-feira para cumprir ou enfrentar penalidades, incluindo o cancelamento do contrato.
O Atlântico Relata Aumento da Violência Anti-IA e Reação Política
Bernie Sanders e Steve Bannon condenam a IA como uma ameaça aos trabalhadores. Um ataque com coquetel Molotov à casa de Sam Altman e o tiroteio contra um vereador de Indianápolis mostram que a violência contra centros de dados está aumentando.

GPT-5.5 já disponível no GitHub Copilot com multiplicador premium de 7,5x
O GPT-5.5 da OpenAI chega ao GitHub Copilot, oferecendo codificação agente multi-etapas melhorada com um multiplicador promocional de 7,5× para usuários Pro+, Business e Enterprise.

Gemini Embedding 2: O Primeiro Modelo de Embedding Nativamente Multimodal da Google Lançado
O Google lançou o Gemini Embedding 2, seu primeiro modelo de embedding nativamente multimodal que mapeia texto, imagens, vídeo, áudio e documentos em um único espaço de embedding. O modelo suporta até 8192 tokens de texto, 6 imagens por solicitação, 120 segundos de vídeo e PDFs de até 6 páginas, com dimensões de saída flexíveis de 3072 até 768.