Беркли: даже запрос «сохранить голос» делает прозу формальнее при любых AI-правках

Том ван Нюнен из Беркли пропустил 300 личных повествований через три фронтальные модели (класс Claude, класс ChatGPT, класс Gemini) в трех условиях подсказок: общее «улучши это», общее «перепиши это» и явное «пересмотри это, сохраняя исходный голос». Он измерил 13 стилометрических маркеров на входе и выходе: служебные слова, сокращения, местоимения первого лица, разнообразие лексики, вариативность длины предложений, шаблоны пунктуации и эмоциональные слова.
Результат: каждая модель в каждом условии дрейфовала в одном направлении. На выходе было меньше сокращений, меньше местоимений первого лица, большее лексическое разнообразие, более длинные слова и более сложная пунктуация. Сдвиг перемещал прозу от погруженного повествования к дистанцированному. Подсказка «сохранить голос» лишь уменьшала величину дрейфа, но не его направление.
Простыми словами: любая подсказка для ИИ делает прозу более вежливой, более формальной, более стремящейся угодить — даже когда подсказка говорит не делать этого.
Последствия для инструментов
Статья утверждает, что инструкции по голосу находятся на уровне, который пост-тренировочное распределение модели переопределяет в течение одного-двух абзацев. Любой, кто итерирует подсказки, вставки образцов, пользовательские инструкции или описания персонажей для голосового вывода (письмо, диалоги, маркетинговые тексты, убедительные эссе), работал над проблемой со структурным потолком.
Это также дает наиболее чистое эмпирическое объяснение регрессии прозы Claude 4.7: центральный голос 4.7 закодирован глубже, чем у 4.6, поэтому он лучше читает стилометрическую структуру (как видно из эксперимента Piper) и сильнее сопротивляется отклонениям (жалобы на мемо-голос).
Архитектура на основе ограничений
Рекомендация автора: если вы хотите сохранения голоса в длинных работах, архитектура должна находиться за пределами подсказки. Скомпилированные стилевые профили должны применяться как связывающие ограничения к каждой генерации — а не как параметры подсказки, которые могут быть переопределены. Разбор того, почему каждый крупный инструмент для письма (Sudowrite, NovelCrafter, прямой Claude/ChatGPT) сталкивается с тем же потолком, и как выглядит архитектура на основе ограничений на практике, доступен в прикрепленном ниже посте блога.
Статья: https://arxiv.org/abs/2604.22142
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Qwen 3 8B превосходит более крупные модели в слепых экспертных оценках сложных задач.
В слепом парном оценивании 10 небольших языковых моделей на 13 сложных задачах передового уровня, Qwen 3 8B победил в 6 оценках и вошёл в тройку лучших в 12 из 13 задач, превзойдя модели с количеством параметров до 4 раз больше. Оценка охватывала отладку распределённых блокировок, конкурентные ошибки Go, оптимизацию SQL, байесовскую медицинскую диагностику, парадокс Симпсона, теорему голосования Эрроу и анализ ошибки выжившего.

Чего не хватает в истории об «агентности»: четко определенной роли пользовательского агента
Марк Ноттингем утверждает, что современным ИИ-агентам не хватает четко определенной роли пользовательского агента, что создает разрыв доверия между тем, что ожидают пользователи, и тем, что на самом деле делают агенты.

GitHub Copilot переходит на тарификацию по использованию: конец субсидированного ИИ-кодирования
Microsoft начнет взимать с пользователей GitHub Copilot плату в соответствии с фактической стоимостью моделей с 1 июня 2026 года, прекратив субсидирование в размере $20+ в месяц на пользователя. Причиной названо использование агентного ИИ.

Cowork жестко прописывает средние усилия и игнорирует пользовательские настройки для Claude Opus.
Пользователь с планом Max обнаружил, что Cowork передает --effort medium --model claude-opus-4-6 как жестко заданные флаги CLI, игнорируя переменные окружения и переопределения в settings.json. Это означает, что пользователи заперты на среднем уровне усилий и стандартном окне контекста, несмотря на оплату высокого уровня усилий и доступа к 1M контексту.