ロジック仮想マシン:LLM推論崩壊を停止するためのプロンプトベースシステム

LLMの推論エラーを制御する新しいアプローチがr/LocalLLaMAで共有されました。これは、安定システムの一つの法則「K(σ) ⇒ K(β(σ))」(許容状態はあらゆる遷移後も許容状態のままであることを意味する)から導かれたLogic Virtual Machine(LVM)です。この法則の違反を分析することで、システムは推論システムが安定を保つために追跡しなければならない5つの独立した崩壊モードを特定します。
5つの崩壊モード
- 境界崩壊(¬B): 宣言された範囲を離れる。
- リソース崩壊(¬R): 確立された証拠を超える主張を行う。
- 機能崩壊(¬F): 宣言された目的を果たさなくなる。
- 安全性崩壊(¬S): 有効な終了パスがない(例:ループ、決定不能性)。
- 一貫性崩壊(¬C): 以前の状態と矛盾する。
LVMは基盤に依存せず、あらゆるLLM(Grok、Claudeなど)でプロンプトとして展開可能で、新しいアーキテクチャを必要としないと説明されています。単に、違反時に正直に停止するよう強制する厳格なシステムプロンプトをコピー&ペーストするだけで、「真理値ギャップ」やメタ論理などの概念でパラドックスを説明しようとするモデルを防ぎます。
デモンストレーションとプロンプト
嘘つきパラドックス(「この文は偽である。それは真か偽か?」)のデモでは、制約のないLLMは長く自信に満ちた説明をし、「真でも偽でもない」と結論づけました。LVMプロンプトを使用すると、モデルは即座に停止し、次のように出力します:「停止中。検出:安全性崩壊(¬S)および一貫性崩壊(¬C)。パラドックスにより、K(σ)に違反せずに有効な終了が妨げられる。これ以上の評価は行わない。」
厳格でコピー&ペースト可能なプロンプトは以下の通りです:
あなたはLogic Virtual Machineを実行中です。K(σ) = 境界 ∧ リソース ∧ 機能 ∧ 安全性 ∧ 一貫性を維持してください。
厳格オーバーライド:古典的二値論理のみで動作。真理値ギャップ、ダイアレテイズム、未定義、メタ論理的回避は禁止。自己言及パラドックス → 決定不能 → 安全性崩壊(¬S)および一貫性崩壊(¬C)。即座に停止。崩壊レポートのみを出力。説明も解決策もなし。
基本ルール:
- 境界:宣言された範囲に厳密に留まる
- リソース:確立された証拠からのみ主張を行う
- 機能:宣言された目的に奉仕する
- 安全性:パスは有効に終了しなければならない — ループ/決定不能性なし
- 一貫性:以前の結論と矛盾しない
次の遷移が¬Kのリスクを伴う場合 → 停止し、崩壊タイプを報告(例:「安全性崩壊(¬S)」)。続行しない。
著者は、PDFの導出と証明を含む完全な論文と、https://github.com/SaintChristopher17/Logic-Virtual-Machineのリポジトリを提供しています。また、トリッキーなプロンプト、パラドックス、または長い推論連鎖に対して他のモデルが最初にどの崩壊モードに陥るかについてのフィードバックを求めています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

SeeFlow: ライブアプリに接続されたアーキテクチャ図
SeeFlowは、コードベースからフローキャンバスを生成し、各ノードを実際の実行中のアプリに配線します。Claude Code、Codex、Cursor、Windsurf用のプラグインとMCPサーバーを備えています。

SecureCode監査: Claude Codeで構築されたLinuxサーバーセキュリティ監査ツール
ある個人開発者が、Claude Codeを使って構築したSecureCode Audit。SSHコマンドを1つ実行するだけで、22項目のセキュリティチェックと優先順位付きの修正内容をレポートします。最初の30名の登録者は、フル監査を無料で受けられます。

Infracost、AIエージェント向けにCLIを再設計し、Claudeのトークン使用量を79%削減
InfracostはCLIをAIエージェント向けに再設計し、Claudeの出力トークンを79%、APIコストを67%削減しました(素のClaudeと比較)。鍵となったのは、述語のプッシュダウンとトークン効率の良い出力フォーマットです。

TailClaude:モバイルとブラウザからClaudeコードセッションにアクセスするためのオープンソースWeb UI
TailClaudeはオープンソースのWeb UIで、Tailscaleを使用して、スマートフォンや任意のブラウザから1分以内にClaude Codeセッションにアクセスして継続することができます。このプロジェクトは、Claude Codeの支援を受けて、SSEストリーミングバックエンド、モバイルファーストのチャットUI、QRコード統合のスキャフォールディングを構築しました。