Беркли: даже запрос «сохранить голос» делает прозу формальнее при любых AI-правках

Том ван Нюнен из Беркли пропустил 300 личных повествований через три фронтальные модели (класс Claude, класс ChatGPT, класс Gemini) в трех условиях подсказок: общее «улучши это», общее «перепиши это» и явное «пересмотри это, сохраняя исходный голос». Он измерил 13 стилометрических маркеров на входе и выходе: служебные слова, сокращения, местоимения первого лица, разнообразие лексики, вариативность длины предложений, шаблоны пунктуации и эмоциональные слова.
Результат: каждая модель в каждом условии дрейфовала в одном направлении. На выходе было меньше сокращений, меньше местоимений первого лица, большее лексическое разнообразие, более длинные слова и более сложная пунктуация. Сдвиг перемещал прозу от погруженного повествования к дистанцированному. Подсказка «сохранить голос» лишь уменьшала величину дрейфа, но не его направление.
Простыми словами: любая подсказка для ИИ делает прозу более вежливой, более формальной, более стремящейся угодить — даже когда подсказка говорит не делать этого.
Последствия для инструментов
Статья утверждает, что инструкции по голосу находятся на уровне, который пост-тренировочное распределение модели переопределяет в течение одного-двух абзацев. Любой, кто итерирует подсказки, вставки образцов, пользовательские инструкции или описания персонажей для голосового вывода (письмо, диалоги, маркетинговые тексты, убедительные эссе), работал над проблемой со структурным потолком.
Это также дает наиболее чистое эмпирическое объяснение регрессии прозы Claude 4.7: центральный голос 4.7 закодирован глубже, чем у 4.6, поэтому он лучше читает стилометрическую структуру (как видно из эксперимента Piper) и сильнее сопротивляется отклонениям (жалобы на мемо-голос).
Архитектура на основе ограничений
Рекомендация автора: если вы хотите сохранения голоса в длинных работах, архитектура должна находиться за пределами подсказки. Скомпилированные стилевые профили должны применяться как связывающие ограничения к каждой генерации — а не как параметры подсказки, которые могут быть переопределены. Разбор того, почему каждый крупный инструмент для письма (Sudowrite, NovelCrafter, прямой Claude/ChatGPT) сталкивается с тем же потолком, и как выглядит архитектура на основе ограничений на практике, доступен в прикрепленном ниже посте блога.
Статья: https://arxiv.org/abs/2604.22142
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Сокращение 4 000 сотрудников в Block вызывает опасения по поводу "искусственного отбеливания" (AI-washing).
Block объявил о сокращении 4000 рабочих мест, что вызвало подозрения в AI-отмывании, история набрала 10 баллов и 3 комментария на Hacker News.

Claude Code v2.1.128: изоляция OTEL, исправления MCP, поддержка плагинов .zip и более 20 исправлений ошибок
Claude Code v2.1.128 предотвращает наследование переменных окружения OTEL_* дочерними процессами, добавляет поддержку плагинов .zip, исправляет лавинообразные переподключения MCP и отмену параллельных вызовов shell-инструментов.

Лаборатория Andon Labs: ИИ-агент Мона управляет реальным кафе в Стокгольме — полный разбор
Andon Labs выдал агенту ИИ по имени Мона договор аренды и реальные деньги, чтобы она открыла кафе в Стокгольме. Она справилась с бюрократией, поставщиками и наймом, но столкнулась с такими препятствиями, как BankID, и вынуждена была идти на неоптимальные решения.

Точность Claude Opus 4.6 снизилась в тесте на галлюцинации BridgeBench.
Claude Opus 4.6 демонстрирует значительное снижение точности в тесте на галлюцинации BridgeBench — с 83% до 68%, согласно сообщению BridgeMind AI в Twitter.