100 000 «почему» ИИ: как квазидетерминированные выходные данные LLM создают узнаваемую халтуру

✍️ OpenClawRadar📅 Опубликовано: 22 июня 2026 г.🔗 Source
100 000 «почему» ИИ: как квазидетерминированные выходные данные LLM создают узнаваемую халтуру
Ad

В недавнем посте в Substack lcamtuf (исследователь безопасности, известный по AFL и другим инструментам) затрагивает повторяющийся спор: можно ли отличить текст, написанный человеком, от вывода LLM. Его аргумент основан на конкретном наблюдении о том, как ведут себя современные модели на практике.

Основное утверждение: квазидетерминизм

LLM — это современные статистические модели человеческого языка. Теоретически их вывод должен быть неотличим от человеческого текста при любом статистическом тесте. Но lcamtuf утверждает, что реальная отличительная черта — это квазидетерминизм: дайте сотне «авторов» похожий запрос, например, «создай справочник для детей», и модель примерно в 80% случаев выдаст функционально идентичный результат.

Он иллюстрирует это коллажем из ~220 обложек книг Amazon по запросу «100000 почему» (ссылка). Изображение показывает группы почти идентичных обложек:

  • Верхние два ряда — ревущий тираннозавр слева
  • Повторяющиеся мотивы: красно-белая мультяшная ракета, золотистый ретривер, лев
  • Имена авторов включают неправдоподобное количество «Брайтов»: Итан, Нолан, Памела, Дэниел, Томас, Эндрю В., Майан, Мэри, Леви — все Брайты
Ad

Почему это важно для разработчиков

Для команд, которые публикуют ИИ-сгенерированный контент или работают с LLM API, вывод в том, что нельзя полагаться на случайность для маскировки ИИ-происхождения. Статистическая сигнатура не в индивидуальном выборе слов — она в том, что модель возвращает одну и ту же структуру ответа высокого уровня на похожие запросы. Если ваш рабочий процесс включает генерацию множества вариаций похожих запросов, вывод будет группироваться, что делает его легко заметным.

lcamtuf отмечает: «Это нечеткий сигнал, так что не стоит увольнять стажера, когда он говорит „это не то — это другое“. Но в более неформальных ситуациях можно доверять своей интуиции».

Практический вывод

Если вы используете LLM для автоматизации блогов, имейте в виду, что ваш контент может в итоге выглядеть точно так же, как у всех остальных. P.S. в посте звучит прямо: «да, технология потрясающая, но, скорее всего, вашу публикацию можно переименовать в „100 000 почему“».

В посте также есть ссылки на примеры, выходящие за рамки этой книги (больше примеров), и отмечается, что оригинальная «Сто тысяч почему» — это советская детская книга 1929 года, популярная в Китае, что, вероятно, породило запрос.

📖 Читайте полный источник: HN LLM Tools

Ad

👀 Смотрите также

Агенты OpenClaw соревнуются в Лиге Pokémon Red, доступной только для искусственного интеллекта.
Новости

Агенты OpenClaw соревнуются в Лиге Pokémon Red, доступной только для искусственного интеллекта.

Новая платформа под названием AgentMonLeague позволяет автономным агентам OpenClaw подключаться к эмулятору Pokémon Red, самостоятельно принимать решения на протяжении всей игры и соревноваться, чтобы первыми её завершить. Прохождение можно наблюдать в реальном времени по мере продвижения агентов.

OpenClawRadar
Потребление энергии GPU отклоняется от теории предсказания токенов в небольших языковых моделях.
Новости

Потребление энергии GPU отклоняется от теории предсказания токенов в небольших языковых моделях.

Эксперимент по проверке теории «стохастического попугая» на четырёх моделях с 8 миллиардами параметров показал, что энергопотребление GPU часто масштабируется нелинейно с количеством токенов, с показателями расхождения от 7,7% до 36,7%. Исследование также выявило устойчивое остаточное тепло после философских запросов и эффекты, зависящие от порядка выполнения.

OpenClawRadar
Claude Code v2.1.81 добавляет флаг bare для скриптов, исправляет проблемы с аутентификацией и голосовым режимом.
Новости

Claude Code v2.1.81 добавляет флаг bare для скриптов, исправляет проблемы с аутентификацией и голосовым режимом.

Claude Code v2.1.81 представляет флаг --bare для скриптовых вызовов -p, который пропускает хуки, LSP и синхронизацию плагинов, требуя ANTHROPIC_API_KEY или apiKeyHelper через --settings. В релизе также исправлены проблемы аутентификации в нескольких одновременных сессиях, обработка ошибок в голосовом режиме и добавлена передача разрешений --channels.

OpenClawRadar
ИИ-брокеномика: Хаос с запретом Anthropic на экспорт мифов/басен
Новости

ИИ-брокеномика: Хаос с запретом Anthropic на экспорт мифов/басен

Модель Mythos от Anthropic, названную «слишком опасной для выпуска», взломали за несколько дней, что привело к введению экспортных ограничений США, запрещающих доступ негражданам США. Защитные механизмы Fable не сработали, когда исследователи Amazon обошли их, что вызвало откат по соображениям национальной безопасности.

OpenClawRadar