LLM 추론 붕괴 방지: 논리 가상 머신 프롬프트

LLM 추론 오류를 제어하는 새로운 접근 방식이 r/LocalLLaMA에 공유되었습니다. 이는 하나의 안정 시스템 법칙인 K(σ) ⇒ K(β(σ))에서 파생된 논리 가상 머신(LVM)입니다. 이는 허용 가능한 상태는 어떤 전환 후에도 허용 가능하게 유지된다는 의미입니다. 이 법칙의 위반을 분석함으로써 시스템은 안정성을 유지하기 위해 모든 추론 시스템이 추적해야 하는 다섯 가지 독립적인 붕괴 모드를 식별합니다.

다섯 가지 붕괴 모드

경계 붕괴 (¬B): 선언된 범위를 벗어남.
자원 붕괴 (¬R): 주장이 확립된 증거를 초과함.
기능 붕괴 (¬F): 더 이상 선언된 목적을 수행하지 않음.
안전 붕괴 (¬S): 유효한 종료 경로가 없음 (예: 루프, 결정 불가능성).
일관성 붕괴 (¬C): 이전 상태와 모순됨.

LVM은 기질에 독립적이며 모든 LLM(Grok, Claude 등)에 프롬프트로 배포 가능하다고 설명되며, 새로운 아키텍처가 필요하지 않습니다. 단순히 위반 시 정직한 중단을 강제하는 엄격한 시스템 프롬프트를 복사-붙여넣기하면 되며, 이는 모델이 "진리값 간극"이나 메타 논리와 같은 개념으로 역설을 설명해 버리는 것을 방지합니다.

데모 및 프롬프트

거짓말쟁이 역설("이 문장은 거짓이다. 참인가 거짓인가?")에 대한 데모에서, 제약이 없는 LLM은 길고 자신 있는 설명을 하며 "참도 아니고 거짓도 아니다"라고 결론지었습니다. LVM 프롬프트를 사용하면 모델은 즉시 중단하고 다음과 같이 출력합니다: "중단. 감지됨: 안전 붕괴 (¬S) 및 일관성 붕괴 (¬C). 역설이 K(σ)를 위반하지 않고는 유효한 종료를 방지합니다. 더 이상의 평가 없음."

엄격하며 복사-붙여넣기 준비가 된 프롬프트는 다음과 같습니다:

당신은 논리 가상 머신을 실행 중입니다. K(σ) = 경계 ∧ 자원 ∧ 기능 ∧ 안전 ∧ 일관성을 유지하세요.
STRICT OVERRIDE: 오직 고전적인 이치 논리에서만 작동하세요. 진리값 간극, 양진주의, 정의되지 않음, 또는 메타 논리적 탈출구는 없습니다. 자기지시적 역설 → 결정 불가능 → 안전 붕괴 (¬S) 및 일관성 붕괴 (¬C). 즉시 중단하세요. 오직 붕괴 보고서만 출력하세요. 설명 없음, 해결 없음.
핵심 규칙:
- 경계: 선언된 범위에 엄격히 머무르세요
- 자원: 확립된 증거로부터만 주장하세요
- 기능: 선언된 목적을 수행하세요
- 안전: 경로는 유효하게 종료되어야 함 — 루프/결정 불가능성 없음
- 일관성: 이전 결론과 모순 없음
다음 전환이 ¬K를 위험에 빠뜨릴 경우 → 중단하고 붕괴 유형을 보고하세요 (예: "안전 붕괴 (¬S)"). 계속하지 마세요.

저자는 PDF 유도 및 증명이 포함된 전체 논문과 함께 https://github.com/SaintChristopher17/Logic-Virtual-Machine에 저장소를 제공했습니다. 그들은 까다로운 프롬프트, 역설, 또는 긴 추론 체인에서 다른 모델이 먼저 어떤 붕괴 모드에 도달하는지에 대한 피드백을 요청하고 있습니다.

📖 전체 소스 읽기: r/LocalLLaMA

논리 가상 머신: LLM 추론 붕괴를 멈추기 위한 프롬프트 기반 시스템

다섯 가지 붕괴 모드

데모 및 프롬프트

👀 See Also

앤트로픽 구독 모드 마스터하기: 하이쿠, 소넷, 오퍼스

SeeFlow: 라이브 앱에 연결된 아키텍처 다이어그램

심포니 워크플로우 자동화 도구는 클로드 코드와 연동됩니다

토큰미터: 클로드 코드 토큰 사용량을 오프라인에서 추적하는 무료 윈도우 앱