Enquête sur les serveurs de mémoire Markdown locaux pour agents IA : Mem0, Hindsight, Zep et le nouveau venu Engram
Un utilisateur de Reddit a demandé un système de mémoire entièrement local pour agent, stockant les souvenirs sous forme de fichiers Markdown lisibles — pas une base de données ou un service cloud. Après avoir reçu ~20 suggestions et toutes les testées, voici le bilan de ce que chaque outil offre réellement et où se trouvent les lacunes.
Systèmes non-mémoire signalés
Plusieurs outils suggérés ne sont pas des systèmes de mémoire : ChromaDB est une base de données vectorielle ; qmd est un moteur de recherche de documents sans pipeline d'écriture ; ContextKeep fait de la compression de contexte ; LCM ne préserve que le contexte de session.
Options établies
- mem0 — leader du marché, mémoire basée sur des graphes, SDKs en plusieurs langages, échelle production. Inconvénients : utilise OpenAI par défaut, penche vers l'hébergement, stocke dans une base de données opaque.
- Hindsight — graphe de connaissances, résolution d'entités, gère les souvenirs contradictoires. Nécessite Postgres + base vectorielle, le stockage est SQL — impossible de lire les fichiers directement.
- Zep — le plus ancien, mémoire multimodale, extraction structurée. Priorité cloud, infrastructure similaire à Hindsight.
- Honcho — apprentissage continu, architecture stateful, plus orienté recherche. Licence AGPL + dépendance cloud.
Options spécifiques à OpenClaw
- memory-lancedb-pro — le plugin mémoire le plus puissant pour OpenClaw, recherche hybride, modèle de décroissance, activement maintenu. Pas un serveur autonome.
- GBrain — d'abord MCP, intégration OpenClaw correcte, inutile en dehors de l'écosystème.
Le nouveau venu le plus intéressant : mnem
mnem est un binaire unique Rust, sans dépendances Python/Ollama/externes. Décrit comme « git pour les mémoires d'agents » : branche, diff, merge, revert. Utilise GraphRAG. Performances comparables à mem0. Deux semaines d'existence — couverture de tests légère. Le stockage est constitué de nœuds de graphe indexés par contenu, pas de fichiers lisibles.
La lacune et ce qui la comble : Engram
Aucun des outils testés ne combinait entièrement local + stockage en fichiers lisibles par l'humain + déduplication intelligente + décroissance de l'importance + serveur autonome sans exigences d'infrastructure. Engram par Obsidian68 (github.com/Obsidian68/Engram) est tout nouveau (presque aucune étoile) mais coche les quatre cases :
- Souvenirs stockés sous forme de fichiers Markdown dans un dossier — ouvrables dans VS Code, modifiables, supprimables.
- API REST complète et serveur MCP.
- Déduplication intelligente à l'écriture, décroissance de l'importance pour les souvenirs plus anciens.
- Fonctionne entièrement sur Ollama — pas de clés API, pas d'appels externes, entièrement local.
Si la confidentialité et la lisibilité sont importantes pour la connaissance de votre agent, Engram est actuellement la seule solution complète.
📖 Lire la source originale : r/openclaw
👀 See Also

Latence zéro : une couche de mémoire persistante pour les agents IA via MCP
0Latency est un serveur MCP qui ajoute une mémoire persistante à Claude et à d'autres agents d'IA, stockant les souvenirs entre les sessions pour éviter la perte de contexte. Il fonctionne nativement avec Claude Desktop, Claude Code, claude.ai, GPT, Gemini, Cursor et tout agent compatible MCP.

Zikra : Serveur de mémoire MCP auto-hébergé pour Claude Code, Cursor et Codex
Zikra est un serveur de mémoire MCP auto-hébergé qui enregistre automatiquement chaque décision, erreur et exigence à la fin des sessions Claude Code via un crochet d'arrêt, créant un pool de mémoire partagé accessible à travers les outils et les membres de l'équipe.

agentcache : Bibliothèque Python pour la mise en cache de préfixes LLM multi-agents
agentcache est une bibliothèque Python qui permet aux frameworks multi-agents LLM de partager des préfixes de prompts mis en cache, atteignant jusqu'à 76 % de taux de succès de cache et réduisant le temps d'inférence de plus de moitié dans les tests avec GPT-4o-mini.

Interface chatbot monopage pour Gemma 4 26B A4B fonctionnant localement
Un développeur a créé un chatbot sur une seule page HTML conçu pour fonctionner avec Gemma 4 26B A4B exécuté localement. L'implémentation se connecte à l'API de LM Studio et fournit une interface complète de chatbot dans un seul fichier HTML.