Анализ антропоморфизма в чате Claude Pokemon с использованием байесовских моделей

✍️ OpenClawRadar📅 Опубликовано: 14 марта 2026 г.🔗 Source
Анализ антропоморфизма в чате Claude Pokemon с использованием байесовских моделей
Ad

Методология исследования и сбор данных

Исследователь провёл статистический анализ сообщений чата Twitch из бенчмарка Claude Plays Pokemon, чтобы изучить, как пользователи антропоморфизируют системы искусственного интеллекта. Исследование было сосредоточено конкретно на сегменте Mt. Moon, который в первый раз занял у Claude примерно 3 дня для завершения. В течение этого периода данные чата непрерывно собирались через API Twitch в течение нескольких недель.

Исследователь использовал Gemini 2.0 Flash для аннотации 107 000 сообщений по различным признакам, включая наличие у Claude ложного убеждения, застревания или проявления антропоморфизации. Была проведена ручная проверка выборки для валидации процесса разметки, который имел некоторые ошибки, но считался удовлетворительным.

Ad

Анализ данных и результаты

Антропоморфизация была упрощена до четырёх категорий на основе предыдущих исследований, причём когнитивная антропоморфизация оказалась наиболее распространённым типом. Это логично, учитывая, что Claude отображал свои рассуждения в реальном времени во время бенчмарка.

Анализ показал, что сообщения, касающиеся ложных убеждений Claude, с гораздо большей вероятностью содержали антропоморфизацию, чем сообщения без таких тегов. События ложных убеждений были относительно редкими — примерно 700 сообщений по сравнению с полной выборкой Mt. Moon около 87 000 сообщений.

Используя байесовские модели со смешанными эффектами с разными уровнями информативных априорных распределений, исследователь обнаружил, что ложное убеждение является одним из самых сильных предикторов антропоморфизации. Даже при сильных априорных распределениях тег ложного убеждения был связан с примерно на 15 процентных пунктов более высокой прогнозируемой вероятностью антропоморфизации. В слабых/умеренных моделях вероятность возрастала примерно с 11% до 45%.

Доступность данных

Набор данных доступен для скачивания и дальнейшего анализа по адресу: https://github.com/IMNMV/Claude-Plays-Pokemon

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Команда /insight в Claude Code анализирует паттерны рабочего процесса разработчиков на основе реальных данных об использовании.
Кейсы

Команда /insight в Claude Code анализирует паттерны рабочего процесса разработчиков на основе реальных данных об использовании.

Разработчик, создающий приложение для личных финансов на iOS, использовал новую команду /insight в Claude Code для анализа 22 дней использования: 529 сообщений, 47 604 строк кода, 632 затронутых файла и 146 коммитов. Отчёт выявил эффективные паттерны, такие как 'конвейер аудит-затем-пакетное-исправление', и отметил траты времени, такие как циклы отладки.

OpenClawRadar
Многокомпонентный ИИ-конвейер для написания романов с использованием Claude и Zencoder
Кейсы

Многокомпонентный ИИ-конвейер для написания романов с использованием Claude и Zencoder

Разработчик создал многокомпонентный AI-пайплайн с использованием Claude через Zencoder в WebStorm для написания длинных художественных произведений, опубликовав четыре романа на KDP с циклом от концепции до черновика за считанные дни. Открытый рабочий процесс включает файлы инструкций для агентов с конкретными ролями, такими как генерация идей, проверка согласованности и написание прозы.

OpenClawRadar
Разработчик создает приложение для бухгалтерского учета на основе ИИ с использованием Claude Code
Кейсы

Разработчик создает приложение для бухгалтерского учета на основе ИИ с использованием Claude Code

Разработчик создал AICountant — приложение для бухгалтерского учёта на основе ИИ для фрилансеров и малого бизнеса, используя Claude Code во всём стеке технологий, включая Next.js App Router, Prisma с PostgreSQL и Vercel Blob storage. Приложение извлекает данные с чеков, конвертирует иностранные валюты по историческим курсам и организует всё в поисковый реестр.

OpenClawRadar
Три практических шаблона для заработка с помощью OpenClaw
Кейсы

Три практических шаблона для заработка с помощью OpenClaw

Анализ 100 пользователей OpenClaw выявил три устойчивых подхода: превращение существующих знаний в AI-ассистентов, автоматизация повторяющихся исследований и продажа результатов, экономящих время, а не функций искусственного интеллекта.

OpenClawRadar