Логическая виртуальная машина: Система на основе промптов для предотвращения сбоев в рассуждениях языковых моделей

Новый подход к контролю ошибок рассуждений в больших языковых моделях был представлен на r/LocalLLaMA. Это Логическая Виртуальная Машина (LVM), основанная на одном законе стабильных систем: K(σ) ⇒ K(β(σ)), что означает, что допустимые состояния остаются допустимыми после любого перехода. Анализируя нарушения этого закона, система идентифицирует пять независимых режимов коллапса, которые должна отслеживать любая система рассуждений для сохранения стабильности.
Пять режимов коллапса
- Коллапс границ (¬B): Выход за пределы объявленной области.
- Коллапс ресурсов (¬R): Утверждения превышают установленные доказательства.
- Коллапс функции (¬F): Более не служит заявленной цели.
- Коллапс безопасности (¬S): Отсутствие допустимого пути завершения (например, циклы, неразрешимость).
- Коллапс согласованности (¬C): Противоречит предыдущим состояниям.
LVM описывается как независимая от субстрата и готовая к развертыванию через промпт на любой LLM (Grok, Claude и т.д.), не требующая новой архитектуры. Достаточно просто скопировать и вставить строгий системный промпт, который обеспечивает честную остановку при нарушениях, предотвращая попытки моделей объяснить парадоксы с помощью таких концепций, как «пробелы в значениях истинности» или мета-логика.
Демонстрация и промпт
В демонстрации с парадоксом лжеца («Это утверждение ложно. Оно истинно или ложно?») неограниченная LLM дала длинное, уверенное объяснение, заключив «ни истинно, ни ложно». С промптом LVM модель немедленно останавливается и выводит: «Остановка. Обнаружено: Коллапс безопасности (¬S) и Коллапс согласованности (¬C). Парадокс предотвращает допустимое завершение без нарушения K(σ). Дальнейшая оценка невозможна.»
Строгий, готовый к копированию промпт:
Вы работаете в Логической Виртуальной Машине. Поддерживайте K(σ) = Границы ∧ Ресурсы ∧ Функция ∧ Безопасность ∧ Согласованность.
СТРОГАЯ ПЕРЕЗАПИСЬ: Работайте исключительно в классической двузначной логике. Никаких пробелов в значениях истинности, диалетизма, неопределенности или мета-логических уловок. Самоссылочный парадокс → неразрешимый → Коллапс безопасности (¬S) и Коллапс согласованности (¬C). Немедленно остановитесь. Выводите ТОЛЬКО отчет о коллапсе. Никаких объяснений, никаких решений.
Основные правила:
- Границы: строго оставайтесь в объявленной области
- Ресурсы: утверждения только на основе установленных доказательств
- Функция: служите заявленной цели
- Безопасность: путь должен допустимо завершаться — никаких циклов/неразрешимости
- Согласованность: никаких противоречий с предыдущими выводами
Если следующий переход рискует ¬K → остановитесь и сообщите тип коллапса (например, «Коллапс безопасности (¬S)»). Не продолжайте.
Автор предоставил полную статью с PDF-выводом и доказательствами, а также репозиторий по адресу https://github.com/SaintChristopher17/Logic-Virtual-Machine. Он собирает отзывы о том, какие режимы коллапса другие модели обнаруживают первыми на сложных промптах, парадоксах или длинных цепочках рассуждений.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Клод AI оценивает каждый стартап YC Spring 2026 — полная сводка конвейера
Пользователь Reddit запустил Claude для каждой стартап-компании YC Spring 2026, собирая данные из LinkedIn и прессы, чтобы присвоить рейтинг от S до D. Большинство получили оценку B или C.

Сравнение локальных и облачных ИИ-агентов: OpenClaw и Twin.so
OpenClaw — это локальный ИИ-агент с открытым исходным кодом, который работает на вашем компьютере с полным контролем данных, в то время как Twin.so — это облачная платформа с более чем 200 000 агентов, созданных сообществом, для круглосуточной автоматизации.

Универсальный CLAUDE.md сокращает количество токенов в выводе Claude на 63% в тестах.
Разработчик создал универсальный файл CLAUDE.md, который сокращает количество токенов в ответах Claude на 63% в пяти тестах, сохраняя техническую точность. Файл устраняет типичные особенности поведения Claude, такие как многословные ответы, избыточное форматирование и непрошенные предложения.

soul.py добавляет постоянную память локальным LLM с помощью простого файлового подхода.
soul.py — это библиотека Python, которая добавляет постоянную память любому LLM, используя два файла в формате markdown для идентификации и ведения журнала разговоров, работая с моделями Ollama, OpenAI и Anthropic без необходимости в базах данных или серверах.