Système de Mémoire Bio-Inspiré pour LLM Locaux : Mise en œuvre de la PLT et de l'Oubli Sélectif

✍️ OpenClawRadar📅 Publié: March 25, 2026🔗 Source
Système de Mémoire Bio-Inspiré pour LLM Locaux : Mise en œuvre de la PLT et de l'Oubli Sélectif
Ad

Architecture de Mémoire Bio-Inspirée pour LLMs Locaux

Un développeur a créé un serveur MCP local qui simule les mécanismes de mémoire humaine pour maintenir un contexte propre aux LLMs locaux. Le système implémente trois couches bio-inspirées en Python/TypeScript au lieu d'un pipeline RAG statique.

Mécanismes de Mémoire Fondamentaux

  • Renforcement (Potentialisation à Long Terme) : Chaque fois qu'un sujet est interrogé, son access_count augmente, renforçant les souvenirs fréquemment consultés.
  • Oubli Sélectif : Les connexions inutilisées se dégradent avec le temps, le système archivant automatiquement les atomes faibles pour éviter la pollution du contexte.
  • Consolidation : Un cycle de "sommeil" hebdomadaire distille les journaux récents en atomes de connaissances fondamentaux en utilisant un SLM léger.

Détails d'Implémentation Technique

  • Recherche Hybride : Combine sqlite-vec pour la recherche sémantique avec des solutions de repli textuelles pour éviter les délais d'attente même si les embeddings échouent.
  • MCP Non-Bloquant : Enveloppe les opérations synchrones de base de données et d'embedding dans des exécuteurs asyncio pour garder LM Studio réactif.
  • Couche d'Identité : Utilise un fichier persistant "Soul" (soul.md) pour maintenir l'état et la personnalité entre les sessions.
  • Renforcement Basé sur l'Accès : Le mécanisme access_count permet au modèle d'évoluer en fonction des schémas d'interaction plutôt que de simplement récupérer des faits statiques.
Ad

Contexte de Développement et Validation

Le projet a été développé pour répondre aux limites de contexte dans les implémentations RAG standard pour l'IA locale. Le développeur a validé l'architecture en faisant analyser la base de code par un LLM local (exécutant Gemini), qui a mis en évidence trois innovations : de véritables agents cognitifs utilisant le renforcement basé sur l'accès et la dégradation, une recherche hybride robuste avec solutions de repli, et une architecture non-bloquante pour la réactivité.

L'objectif est de créer un système qui se souvient de ce qui compte et oublie le bruit, similaire à la mémoire humaine pendant le sommeil. Le développeur explore si les architectures de mémoire bio-inspirées peuvent résoudre les limitations de contexte localement sans dépendances cloud ou boîtes noires.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Intégration d'Agents LLM Locaux avec ComfyUI pour la Génération d'Images par Lots en Langage Naturel
Tools

Intégration d'Agents LLM Locaux avec ComfyUI pour la Génération d'Images par Lots en Langage Naturel

Un développeur explique comment il a connecté son agent OpenClaw local à ComfyUI, permettant des commandes en langage naturel pour des flux de travail de génération d'images par lots. L'intégration utilise une compétence d'agent personnalisée qui traduit les requêtes en anglais en JSON de flux de travail ComfyUI et gère la communication API.

OpenClawRadar
Temporal-MCP : Sensibilité à l'horloge murale pour les LLM avec prise en charge OAuth
Tools

Temporal-MCP : Sensibilité à l'horloge murale pour les LLM avec prise en charge OAuth

Temporal-MCP est un serveur MCP minimal qui offre une conscience du temps réel aux LLM, résolvant des modes de défaillance temporels tels que les salutations incorrectes et le contexte obsolète. Il propose deux outils (temporal_tick et temporal_peek) renvoyant le temps écoulé, la détection de changement de jour et un indicateur de nouveau fil.

OpenClawRadar
Modèle de Chat Qwen 3.5 Publié avec 21 Corrections de Bugs pour les Flux de Travail d'Agent
Tools

Modèle de Chat Qwen 3.5 Publié avec 21 Corrections de Bugs pour les Flux de Travail d'Agent

Un développeur a publié un modèle de chat corrigé pour les modèles Qwen 3.5, résolvant 21 bogues, notamment des plantages lors des appels d'outils, la séparation des appels parallèles et la stabilité des boucles d'agents. Il s'agit d'un remplacement direct testé sur llama.cpp, Open WebUI, vLLM et d'autres plateformes.

OpenClawRadar
L'agent ClawsifyAI gère les tâches de courrier électronique, de recherche et de brainstorming
Tools

L'agent ClawsifyAI gère les tâches de courrier électronique, de recherche et de brainstorming

Un développeur a testé ClawsifyAI, un robot griffeur de style agent IA, pendant une semaine et a constaté qu'il gérait les e-mails, les recherches, les tâches répétitives et les séances de brainstorming. L'agent fournit des retours clairs, des solutions pratiques et parfois de meilleures idées que celles initialement prévues.

OpenClawRadar