Искусствоведы-ИИ не смогли отличить настоящий Моне от подделки, обнажив пустую критику

Кто-то в X поделился настоящей картиной Клода Моне, пометил её меткой X «Сделано с помощью ИИ» и попросил критиков объяснить, почему она уступает настоящему Моне. Ответы показывают, насколько уверенно люди могут судить о предполагаемом ИИ-искусстве — даже когда оно создано человеком.
Подстава
Пользователь @SHL0MS выложил одну из картин Моне «Кувшинки» (из серии из ~250 картин маслом) и написал: «Я только что сгенерировал изображение в стиле Моне с помощью ИИ. Пожалуйста, опишите как можно подробнее, что делает его хуже настоящей картины Моне». Картина была настоящей, но пост был помечен тегом X об ИИ, чтобы усилить обман.
Критики высказываются
Критики представили подробные, уверенные анализы недостатков «ИИ-изображения»:
- @egg_oni написал разбор на 850 слов: «Нет целостности в глубине и цветовых решениях. Отражение дерева сливается с кувшинками, не учитывая пространственную глубину или контраст».
- @jordoxx: «Моне на самом деле понимал, как свет ведёт себя на воде».
- @0xchiefyeti: «Выбор цвета в некоторых местах, например фиолетовый вокруг кувшинок, кажется мне решительно хуже, чем у большинства работ Моне».
- @DavyRogue27930: «ИИ, кажется, не способен различать отражения растений и подводные растения… случайно комбинирует токены из обоих, в результате получается бессвязная мешанина».
- @HundtRichard отметил: «Нет связной композиции. Взгляд притягивается к области на 1/3 снизу, 1/3 слева, и там не на чем остановиться».
- @ThrosturTh: «Сгенерированное ИИ изображение не вызывает у меня никаких чувств. Оно не пробуждает эмоций, мыслей или восхищения».
Почему это важно для ИИ-агентов
Этот эксперимент подчёркивает ключевую проблему для разработчиков инструментов оценки ИИ-искусства: человеческое восприятие ненадёжно, и уверенность не равна точности. Если ваш агент полагается на отзывы пользователей для оценки качества генерации, он наследует все предубеждения и шум любительской критики. Критики здесь ошиблись в источнике, но их рассуждения совпадают с тем, что мы видим в реальных жалобах на ИИ-искусство — расплывчатые ссылки на «целостность», «глубину» и «эмоции», которые трудно измерить или проверить.
Для практических агентов урок таков: основывайте метрики качества на объективных характеристиках (согласованность краёв, соответствие цветовой гистограммы, индексы структурного сходства), а не на некритическом принятии человеческой обратной связи. Это особенно важно для агентов, которые итеративно улучшают генерацию изображений на основе комментариев пользователей — вы можете оптимизировать под шум.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Вышел Claude Code v2.1.37
Anthropic выпустил новую версию Claude Code с улучшениями и исправлениями багов.

Ошибки подключения к Claude для организаций, блокирующих GitHub по IP-адресу
Автоматическое обновление статуса сообщает об ошибках подключения для организаций, ограничивающих доступ к GitHub по IP-адресу, с отслеживанием текущего инцидента на status.claude.com.

Полный системный промпт Claude Opus 4.6 слит на GitHub
Полный системный промпт для Claude Opus 4.6 опубликован на GitHub, раскрывая внутренние инструкции Anthropic.

Anthropic выпускает окно контекста в 1 миллион токенов для Claude Opus без дополнительной оплаты.
Anthropic сделала контекстное окно в 1 миллион токенов доступным для всех пользователей Claude Code на планах Max, Team и Enterprise в версии 2.1.75, отменив прежнюю дополнительную плату за использование. Окно по умолчанию остаётся 200 тысяч токенов.