Логическая виртуальная машина: Система на основе промптов для предотвращения сбоев в рассуждениях языковых моделей

Новый подход к контролю ошибок рассуждений в больших языковых моделях был представлен на r/LocalLLaMA. Это Логическая Виртуальная Машина (LVM), основанная на одном законе стабильных систем: K(σ) ⇒ K(β(σ)), что означает, что допустимые состояния остаются допустимыми после любого перехода. Анализируя нарушения этого закона, система идентифицирует пять независимых режимов коллапса, которые должна отслеживать любая система рассуждений для сохранения стабильности.
Пять режимов коллапса
- Коллапс границ (¬B): Выход за пределы объявленной области.
- Коллапс ресурсов (¬R): Утверждения превышают установленные доказательства.
- Коллапс функции (¬F): Более не служит заявленной цели.
- Коллапс безопасности (¬S): Отсутствие допустимого пути завершения (например, циклы, неразрешимость).
- Коллапс согласованности (¬C): Противоречит предыдущим состояниям.
LVM описывается как независимая от субстрата и готовая к развертыванию через промпт на любой LLM (Grok, Claude и т.д.), не требующая новой архитектуры. Достаточно просто скопировать и вставить строгий системный промпт, который обеспечивает честную остановку при нарушениях, предотвращая попытки моделей объяснить парадоксы с помощью таких концепций, как «пробелы в значениях истинности» или мета-логика.
Демонстрация и промпт
В демонстрации с парадоксом лжеца («Это утверждение ложно. Оно истинно или ложно?») неограниченная LLM дала длинное, уверенное объяснение, заключив «ни истинно, ни ложно». С промптом LVM модель немедленно останавливается и выводит: «Остановка. Обнаружено: Коллапс безопасности (¬S) и Коллапс согласованности (¬C). Парадокс предотвращает допустимое завершение без нарушения K(σ). Дальнейшая оценка невозможна.»
Строгий, готовый к копированию промпт:
Вы работаете в Логической Виртуальной Машине. Поддерживайте K(σ) = Границы ∧ Ресурсы ∧ Функция ∧ Безопасность ∧ Согласованность.
СТРОГАЯ ПЕРЕЗАПИСЬ: Работайте исключительно в классической двузначной логике. Никаких пробелов в значениях истинности, диалетизма, неопределенности или мета-логических уловок. Самоссылочный парадокс → неразрешимый → Коллапс безопасности (¬S) и Коллапс согласованности (¬C). Немедленно остановитесь. Выводите ТОЛЬКО отчет о коллапсе. Никаких объяснений, никаких решений.
Основные правила:
- Границы: строго оставайтесь в объявленной области
- Ресурсы: утверждения только на основе установленных доказательств
- Функция: служите заявленной цели
- Безопасность: путь должен допустимо завершаться — никаких циклов/неразрешимости
- Согласованность: никаких противоречий с предыдущими выводами
Если следующий переход рискует ¬K → остановитесь и сообщите тип коллапса (например, «Коллапс безопасности (¬S)»). Не продолжайте.
Автор предоставил полную статью с PDF-выводом и доказательствами, а также репозиторий по адресу https://github.com/SaintChristopher17/Logic-Virtual-Machine. Он собирает отзывы о том, какие режимы коллапса другие модели обнаруживают первыми на сложных промптах, парадоксах или длинных цепочках рассуждений.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Крэг: Инструмент с открытым исходным кодом создает единые правила для ИИ-агентов на основе конфигураций проектов.
Crag — это компилятор с открытым исходным кодом, который анализирует конфигурации проекта, генерирует единый файл governance.md, а затем компилирует его в несколько файлов правил для ИИ-агентов, чтобы предотвратить расхождение конфигураций в таких инструментах, как Claude Code, Cursor и Copilot.

Mozilla Thunderbolt: Клиент с открытым исходным кодом для корпоративного ИИ, предназначенный для самостоятельного размещения инфраструктуры.
Mozilla анонсировала Thunderbolt, клиент с открытым исходным кодом под лицензией MPL 2.0, предназначенный для организаций, которые хотят развернуть собственную инфраструктуру ИИ с возможностью выбора моделей, интеграции корпоративных данных и кроссплатформенными нативными приложениями.

the-knowledge-guy: Превратите свою книжную полку в репетитора с помощью навыков Claude Code
Набор навыков Claude Code, который обрабатывает ваши книги в форматах PDF/EPUB локально и позволяет задавать вопросы, получать объяснения по темам или извлекать шпаргалки — всё с цитированием из вашей библиотеки.

Докент: ИИ-ассистент для анализа научных статей, созданный на основе Claude Code
Разработчик создал Docent, ИИ-ассистента, который читает загруженные научные статьи, представляет их, отвечает на вопросы и оценивает понимание с помощью Claude Code. Проект доступен на GitHub под лицензией MIT с демо на Vercel.