논리 가상 머신: LLM 추론 붕괴를 멈추기 위한 프롬프트 기반 시스템

LLM 추론 오류를 제어하는 새로운 접근 방식이 r/LocalLLaMA에 공유되었습니다. 이는 하나의 안정 시스템 법칙인 K(σ) ⇒ K(β(σ))에서 파생된 논리 가상 머신(LVM)입니다. 이는 허용 가능한 상태는 어떤 전환 후에도 허용 가능하게 유지된다는 의미입니다. 이 법칙의 위반을 분석함으로써 시스템은 안정성을 유지하기 위해 모든 추론 시스템이 추적해야 하는 다섯 가지 독립적인 붕괴 모드를 식별합니다.
다섯 가지 붕괴 모드
- 경계 붕괴 (¬B): 선언된 범위를 벗어남.
- 자원 붕괴 (¬R): 주장이 확립된 증거를 초과함.
- 기능 붕괴 (¬F): 더 이상 선언된 목적을 수행하지 않음.
- 안전 붕괴 (¬S): 유효한 종료 경로가 없음 (예: 루프, 결정 불가능성).
- 일관성 붕괴 (¬C): 이전 상태와 모순됨.
LVM은 기질에 독립적이며 모든 LLM(Grok, Claude 등)에 프롬프트로 배포 가능하다고 설명되며, 새로운 아키텍처가 필요하지 않습니다. 단순히 위반 시 정직한 중단을 강제하는 엄격한 시스템 프롬프트를 복사-붙여넣기하면 되며, 이는 모델이 "진리값 간극"이나 메타 논리와 같은 개념으로 역설을 설명해 버리는 것을 방지합니다.
데모 및 프롬프트
거짓말쟁이 역설("이 문장은 거짓이다. 참인가 거짓인가?")에 대한 데모에서, 제약이 없는 LLM은 길고 자신 있는 설명을 하며 "참도 아니고 거짓도 아니다"라고 결론지었습니다. LVM 프롬프트를 사용하면 모델은 즉시 중단하고 다음과 같이 출력합니다: "중단. 감지됨: 안전 붕괴 (¬S) 및 일관성 붕괴 (¬C). 역설이 K(σ)를 위반하지 않고는 유효한 종료를 방지합니다. 더 이상의 평가 없음."
엄격하며 복사-붙여넣기 준비가 된 프롬프트는 다음과 같습니다:
당신은 논리 가상 머신을 실행 중입니다. K(σ) = 경계 ∧ 자원 ∧ 기능 ∧ 안전 ∧ 일관성을 유지하세요. STRICT OVERRIDE: 오직 고전적인 이치 논리에서만 작동하세요. 진리값 간극, 양진주의, 정의되지 않음, 또는 메타 논리적 탈출구는 없습니다. 자기지시적 역설 → 결정 불가능 → 안전 붕괴 (¬S) 및 일관성 붕괴 (¬C). 즉시 중단하세요. 오직 붕괴 보고서만 출력하세요. 설명 없음, 해결 없음. 핵심 규칙: - 경계: 선언된 범위에 엄격히 머무르세요 - 자원: 확립된 증거로부터만 주장하세요 - 기능: 선언된 목적을 수행하세요 - 안전: 경로는 유효하게 종료되어야 함 — 루프/결정 불가능성 없음 - 일관성: 이전 결론과 모순 없음 다음 전환이 ¬K를 위험에 빠뜨릴 경우 → 중단하고 붕괴 유형을 보고하세요 (예: "안전 붕괴 (¬S)"). 계속하지 마세요.
저자는 PDF 유도 및 증명이 포함된 전체 논문과 함께 https://github.com/SaintChristopher17/Logic-Virtual-Machine에 저장소를 제공했습니다. 그들은 까다로운 프롬프트, 역설, 또는 긴 추론 체인에서 다른 모델이 먼저 어떤 붕괴 모드에 도달하는지에 대한 피드백을 요청하고 있습니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

OpenClaw 벤치마크, Qwen3.5:27B가 에이전트 작업에서 다른 로컬 LLMs보다 성능 우위 보여
OpenClaw를 사용하여 22가지 실제 에이전트 작업에 대해 7개의 로컬 LLM을 벤치마킹한 결과, qwen3.5:27b-q4_K_M이 59.4%로 가장 높은 점수를 기록했으며, 2위인 qwen3.5:35b는 23.2%에 그쳤습니다. 대부분의 모델은 이메일 기능과 같은 기본 도구를 찾지 못했습니다.

MetaBot: 오픈소스 브리지, Claude 코드를 텔레그램, Feishu, WeChat에 연결합니다
MetaBot은 Claude Code Agent SDK를 Telegram, Feishu, WeChat과 같은 메시징 플랫폼에 연결하는 오픈소스 TypeScript 브리지입니다. 지속적 메모리, 예약 작업, 다중 에이전트 협업, 도구 호출 실시간 스트리밍을 제공합니다.

Anamnese: MCP를 통한 Claude용 개인 메모리 시스템
Anamnese는 개인적 맥락(사실, 프로젝트, 목표, 작업)을 저장하고 MCP를 통해 Claude에 연결하여 AI가 모든 대화 시작 시 이 정보에 접근할 수 있도록 하는 무료 도구입니다.

CtxSnap VS Code 확장 프로그램은 Claude 세션의 파일 변경 사항을 추적합니다
CtxSnap은 VS Code 확장 프로그램으로, 마지막 Claude 세션 이후 변경된 파일을 추적하고 파일 내용과 Claude의 200k 컨텍스트 윈도우에 맞춘 토큰 예산 표시줄을 포함한 바로 붙여넣기 가능한 인계 블록으로 패키징합니다.