Mémoire Bio-Inspirée pour LLM Locaux : PLT & Oubli Sélectif

Architecture de Mémoire Bio-Inspirée pour LLMs Locaux

Un développeur a créé un serveur MCP local qui simule les mécanismes de mémoire humaine pour maintenir un contexte propre aux LLMs locaux. Le système implémente trois couches bio-inspirées en Python/TypeScript au lieu d'un pipeline RAG statique.

Mécanismes de Mémoire Fondamentaux

Renforcement (Potentialisation à Long Terme) : Chaque fois qu'un sujet est interrogé, son access_count augmente, renforçant les souvenirs fréquemment consultés.
Oubli Sélectif : Les connexions inutilisées se dégradent avec le temps, le système archivant automatiquement les atomes faibles pour éviter la pollution du contexte.
Consolidation : Un cycle de "sommeil" hebdomadaire distille les journaux récents en atomes de connaissances fondamentaux en utilisant un SLM léger.

Détails d'Implémentation Technique

Recherche Hybride : Combine sqlite-vec pour la recherche sémantique avec des solutions de repli textuelles pour éviter les délais d'attente même si les embeddings échouent.
MCP Non-Bloquant : Enveloppe les opérations synchrones de base de données et d'embedding dans des exécuteurs asyncio pour garder LM Studio réactif.
Couche d'Identité : Utilise un fichier persistant "Soul" (soul.md) pour maintenir l'état et la personnalité entre les sessions.
Renforcement Basé sur l'Accès : Le mécanisme access_count permet au modèle d'évoluer en fonction des schémas d'interaction plutôt que de simplement récupérer des faits statiques.

Contexte de Développement et Validation

Le projet a été développé pour répondre aux limites de contexte dans les implémentations RAG standard pour l'IA locale. Le développeur a validé l'architecture en faisant analyser la base de code par un LLM local (exécutant Gemini), qui a mis en évidence trois innovations : de véritables agents cognitifs utilisant le renforcement basé sur l'accès et la dégradation, une recherche hybride robuste avec solutions de repli, et une architecture non-bloquante pour la réactivité.

L'objectif est de créer un système qui se souvient de ce qui compte et oublie le bruit, similaire à la mémoire humaine pendant le sommeil. Le développeur explore si les architectures de mémoire bio-inspirées peuvent résoudre les limitations de contexte localement sans dépendances cloud ou boîtes noires.

📖 Read the full source: r/LocalLLaMA

Système de Mémoire Bio-Inspiré pour LLM Locaux : Mise en œuvre de la PLT et de l'Oubli Sélectif

Architecture de Mémoire Bio-Inspirée pour LLMs Locaux

Mécanismes de Mémoire Fondamentaux

Détails d'Implémentation Technique

Contexte de Développement et Validation

👀 See Also

oMLX introduit la mise en cache SSD KV pour Apple Silicon, réduisant les temps de réponse d'OpenClaw de 30 à 90 secondes à 5 secondes.

SideX : Un Portage de Visual Studio Code Basé sur Tauri

Engramx v3.4 : Serveur MCP + Graphe de connaissances SQLite réduit de 89 % l'utilisation des tokens de Claude Code

Memora v0.2.25 Serveur MCP : Écritures 5 fois plus rapides sur la base de données D1