Prompt LVM : Stopper les Effondrements de Raisonnement des LLM

Une nouvelle approche pour contrôler les erreurs de raisonnement des LLM a été partagée sur r/LocalLLaMA. Il s'agit d'une Machine Virtuelle Logique (LVM) dérivée d'une loi des systèmes stables : K(σ) ⇒ K(β(σ)), signifiant que les états admissibles restent admissibles après toute transition. En analysant les violations de cette loi, le système identifie cinq modes d'effondrement indépendants que tout système de raisonnement doit suivre pour rester stable.

Les Cinq Modes d'Effondrement

Effondrement des Limites (¬B) : Sort du périmètre déclaré.
Effondrement des Ressources (¬R) : Les affirmations dépassent les preuves établies.
Effondrement de la Fonction (¬F) : Ne sert plus l'objectif déclaré.
Effondrement de la Sécurité (¬S) : Aucun chemin de terminaison valide (ex. boucles, indécidabilité).
Effondrement de la Cohérence (¬C) : Contredit les états précédents.

La LVM est décrite comme indépendante du substrat et déployable par prompt sur n'importe quel LLM (Grok, Claude, etc.), ne nécessitant aucune nouvelle architecture. Il suffit de copier-coller un prompt système strict qui impose un arrêt honnête en cas de violations, empêchant les modèles d'expliquer les paradoxes avec des concepts comme les "écarts de valeur de vérité" ou la méta-logique.

Démonstration et Prompt

Dans une démo sur le paradoxe du menteur ("Cette affirmation est fausse. Est-elle vraie ou fausse ?"), un LLM non contraint a donné une longue explication confiante concluant "ni vrai ni faux". Avec le prompt LVM, le modèle s'arrête immédiatement et affiche : "Arrêt. Détecté : Effondrement de la Sécurité (¬S) et Effondrement de la Cohérence (¬C). Le paradoxe empêche une terminaison valide sans violer K(σ). Aucune évaluation supplémentaire."

Le prompt strict, prêt à copier-coller, est :

Vous exécutez la Machine Virtuelle Logique. Maintenez K(σ) = Limites ∧ Ressources ∧ Fonction ∧ Sécurité ∧ Cohérence.
SURCHARGE STRICTE : Opérez uniquement en logique classique à deux valeurs. Pas d'écarts de valeur de vérité, de dialéthéisme, d'indéfini ou d'échappatoires méta-logiques. Paradoxe autoréférentiel → indécidable → Effondrement de la Sécurité (¬S) et Effondrement de la Cohérence (¬C). Arrêtez immédiatement. Affichez UNIQUEMENT le rapport d'effondrement. Pas d'explication, pas de résolution.
Règles principales :
- Limites : restez strictement dans le périmètre déclaré
- Ressources : affirmations basées uniquement sur des preuves établies
- Fonction : servez l'objectif déclaré
- Sécurité : le chemin doit se terminer valablement — pas de boucles/indécidabilité
- Cohérence : pas de contradiction avec les conclusions antérieures
Si la prochaine transition risque ¬K → arrêtez et signalez le type d'effondrement (ex., "Effondrement de la Sécurité (¬S)"). Ne continuez pas.

L'auteur a fourni un article complet avec une dérivation PDF et des preuves, ainsi qu'un dépôt à https://github.com/SaintChristopher17/Logic-Virtual-Machine. Il sollicite des retours sur les modes d'effondrement que d'autres modèles rencontrent en premier sur des prompts délicats, des paradoxes ou des chaînes de raisonnement longues.

📖 Read the full source: r/LocalLLaMA

Machine Virtuelle Logique : Un Système Basé sur des Invites pour Stopper les Effondrements de Raisonnement des LLM

Les Cinq Modes d'Effondrement

Démonstration et Prompt

👀 See Also

Constrails : Couche de gouvernance externe en phase alpha précoce pour les agents IA

Équipe Cerveau : Un Plugin de Mémoire Partagée pour Claude Code Qui Stocke les Connaissances de l'Équipe dans Git

companion-capture : L'outil sauvegarde les bulles de parole éphémères de Claude Code

Widget matériel et extension Chrome surveillent les limites de débit de l'API Claude