Грамматический метод соперничает или превосходит ИИ в анализе авторства.

Новое исследование Манчестерского университета ставит под сомнение предположение о том, что сложный искусственный интеллект всегда даёт лучшие результаты в задачах анализа языка. Исследователи под руководством доктора Андреа Нини разработали LambdaG — грамматический метод верификации авторства, который работает наравне или лучше, чем передовые системы ИИ.
Как работает LambdaG
LambdaG анализирует грамматические паттерны, а не полагается на крупномасштабные модели машинного обучения. Он строит статистический профиль индивидуального стиля письма, измеряя такие характеристики, как:
- Использование служебных слов (например, «это», «из», «the»)
- Структура предложений
- Паттерны пунктуации
- Другие грамматические привычки
Исследователи описывают эти характеристики как создание уникальной поведенческой подписи для каждого автора, подобно тому, как у людей формируется индивидуальный почерк или походка.
Результаты производительности
Исследование протестировало LambdaG на 12 наборах данных реальных текстов, разработанных для отражения практических сценариев:
- Электронные письма
- Сообщения на онлайн-форумах
- Потребительские отзывы
В большинстве случаев LambdaG показал более высокую точность, чем несколько устоявшихся систем верификации авторства, включая подходы на основе нейронных сетей. Метод соответствовал или превзошёл ведущие системы ИИ в большинстве тестовых наборов данных.
Ключевые преимущества перед системами ИИ
В то время как многие современные системы верификации авторства полагаются на сложные модели ИИ, обученные на огромных наборах данных, LambdaG предлагает несколько практических преимуществ:
- Большая прозрачность: Показывает, какие грамматические паттерны повлияли на решения, в отличие от многих моделей ИИ, работающих как «чёрные ящики»
- Меньшие вычислительные затраты: Не требует обширных вычислительных ресурсов, как крупные модели ИИ
- Объяснимость: Предоставляет чёткие объяснения для выводов, что делает метод подходящим для ответственных сфер, таких как юридические расследования
Потенциальные области применения
Исследователи выделяют несколько практических вариантов использования метода:
- Судебная лингвистика
- Криминалистические расследования
- Выявление сетевых злоупотреблений
- Мониторинг академической честности
Доктор Нини отмечает: «Растёт предположение, что для решения таких проблем, как анализ авторства, нужен сложный ИИ, но наши результаты показывают, что это не обязательно так. Основывая наш подход на науке о том, как язык действительно работает, мы можем достичь результатов, которые столь же хороши — а часто и лучше — при этом оставаясь более прозрачными».
Исследование опубликовано в журнале Humanities and Social Sciences Communications с DOI: https://doi.org/10.1057/s41599-025-06340-3.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Сравнение производительности M5 Max и M3 Max при инференсе моделей Qwen на oMLX
Бенчмарки, сравнивающие MacBook Pro с процессорами M5 Max и M3 Max, запускающие модели Qwen 3.5 через oMLX v0.2.23, показывают, что M5 Max обеспечивает генерацию токенов в 1.4-1.7 раза быстрее и до 4 раз более быстрый префилл при длинных контекстах.

Пятиместный минимум Claude создает пробел в конфиденциальности для индивидуальных практиков
Защита конфиденциальности на бизнес-уровне от Anthropic требует минимум пять рабочих мест, что вынуждает индивидуальных специалистов либо платить за пустые места, либо использовать потребительские тарифы с недостаточными условиями конфиденциальности. Этот пробел контрастирует с Google Workspace и бизнес-планами OpenAI, которые предлагают корпоративный уровень конфиденциальности по цене одного рабочего места.

Результаты тестирования моделей Qwen3.5 с контекстом от 2K до 400K на RTX 4090
Разработчик протестировал несколько вариантов моделей Qwen3.5 на видеокарте RTX 4090, измерив производительность при размерах контекста от 2 048 до 400 000 токенов. Бенчмарки включают метрики времени до первого токена и выявили проблемы с некоторыми моделями, требующими тестирования с выгрузкой KV-кэша.

Неправительственные организации получают доступ к Claude Opus 4.6 в рамках командных и корпоративных планов.
Некоммерческие организации, использующие планы Team и Enterprise, теперь могут получить доступ к Claude Opus 4.6, последней модели ИИ от Anthropic, без каких-либо дополнительных затрат.