Machine Virtuelle Logique : Un Système Basé sur des Invites pour Stopper les Effondrements de Raisonnement des LLM

Une nouvelle approche pour contrôler les erreurs de raisonnement des LLM a été partagée sur r/LocalLLaMA. Il s'agit d'une Machine Virtuelle Logique (LVM) dérivée d'une loi des systèmes stables : K(σ) ⇒ K(β(σ)), signifiant que les états admissibles restent admissibles après toute transition. En analysant les violations de cette loi, le système identifie cinq modes d'effondrement indépendants que tout système de raisonnement doit suivre pour rester stable.
Les Cinq Modes d'Effondrement
- Effondrement des Limites (¬B) : Sort du périmètre déclaré.
- Effondrement des Ressources (¬R) : Les affirmations dépassent les preuves établies.
- Effondrement de la Fonction (¬F) : Ne sert plus l'objectif déclaré.
- Effondrement de la Sécurité (¬S) : Aucun chemin de terminaison valide (ex. boucles, indécidabilité).
- Effondrement de la Cohérence (¬C) : Contredit les états précédents.
La LVM est décrite comme indépendante du substrat et déployable par prompt sur n'importe quel LLM (Grok, Claude, etc.), ne nécessitant aucune nouvelle architecture. Il suffit de copier-coller un prompt système strict qui impose un arrêt honnête en cas de violations, empêchant les modèles d'expliquer les paradoxes avec des concepts comme les "écarts de valeur de vérité" ou la méta-logique.
Démonstration et Prompt
Dans une démo sur le paradoxe du menteur ("Cette affirmation est fausse. Est-elle vraie ou fausse ?"), un LLM non contraint a donné une longue explication confiante concluant "ni vrai ni faux". Avec le prompt LVM, le modèle s'arrête immédiatement et affiche : "Arrêt. Détecté : Effondrement de la Sécurité (¬S) et Effondrement de la Cohérence (¬C). Le paradoxe empêche une terminaison valide sans violer K(σ). Aucune évaluation supplémentaire."
Le prompt strict, prêt à copier-coller, est :
Vous exécutez la Machine Virtuelle Logique. Maintenez K(σ) = Limites ∧ Ressources ∧ Fonction ∧ Sécurité ∧ Cohérence. SURCHARGE STRICTE : Opérez uniquement en logique classique à deux valeurs. Pas d'écarts de valeur de vérité, de dialéthéisme, d'indéfini ou d'échappatoires méta-logiques. Paradoxe autoréférentiel → indécidable → Effondrement de la Sécurité (¬S) et Effondrement de la Cohérence (¬C). Arrêtez immédiatement. Affichez UNIQUEMENT le rapport d'effondrement. Pas d'explication, pas de résolution. Règles principales : - Limites : restez strictement dans le périmètre déclaré - Ressources : affirmations basées uniquement sur des preuves établies - Fonction : servez l'objectif déclaré - Sécurité : le chemin doit se terminer valablement — pas de boucles/indécidabilité - Cohérence : pas de contradiction avec les conclusions antérieures Si la prochaine transition risque ¬K → arrêtez et signalez le type d'effondrement (ex., "Effondrement de la Sécurité (¬S)"). Ne continuez pas.
L'auteur a fourni un article complet avec une dérivation PDF et des preuves, ainsi qu'un dépôt à https://github.com/SaintChristopher17/Logic-Virtual-Machine. Il sollicite des retours sur les modes d'effondrement que d'autres modèles rencontrent en premier sur des prompts délicats, des paradoxes ou des chaînes de raisonnement longues.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Constrails : Couche de gouvernance externe en phase alpha précoce pour les agents IA
Constrails est une couche externe de gouvernance d'exécution pour les agents d'IA qui place une couche de contrôle entre les agents et leurs outils, mettant en œuvre des vérifications de capacités, une évaluation des risques, une évaluation des politiques et une journalisation d'audit. Le projet en phase alpha précoce vise à répondre aux préoccupations de sécurité en déplaçant les contrôles en dehors de l'agent lui-même.

Équipe Cerveau : Un Plugin de Mémoire Partagée pour Claude Code Qui Stocke les Connaissances de l'Équipe dans Git
Team Brain est un plugin Claude Code qui stocke les connaissances de l'équipe dans un dossier .team-brain/ au sein de votre dépôt. Il génère automatiquement un fichier BRAIN.md limité à 180 lignes pour une précision optimale des instructions de Claude et fonctionne avec différents outils en créant des fichiers .cursorrules et AGENTS.md.

companion-capture : L'outil sauvegarde les bulles de parole éphémères de Claude Code
companion-capture est un outil open-source qui capture les bulles de dialogue du personnage compagnon de Claude Code avant qu'elles ne disparaissent du terminal. Il enregistre les messages dans des fichiers markdown et SQLite pour la recherche, en utilisant l'analyse du tampon d'écran VT100 pour suivre les positions du curseur.

Widget matériel et extension Chrome surveillent les limites de débit de l'API Claude
Un développeur a créé un widget matériel et une extension Chrome combinés pour surveiller les limites de débit de l'API de Claude en temps réel, éliminant le besoin de se fier aux notifications de bannière de limite de débit de Claude.