LightMem : Système de mémoire léger pour agents LLM avec des gains de 10×+ et un coût 100× inférieur

✍️ OpenClawRadar📅 Publié: February 26, 2026🔗 Source
LightMem : Système de mémoire léger pour agents LLM avec des gains de 10×+ et un coût 100× inférieur
Ad

LightMem : Une couche mémoire pratique pour les agents LLM

LightMem est un système de mémoire léger et modulaire pour les agents LLM qui répond aux défis des interactions longues et multi-tours où le contexte devient bruyant et coûteux, où les modèles se "perdent au milieu", et où les systèmes de mémoire existants ajoutent de la latence et des coûts en tokens.

Fonctionnement de LightMem

Le système maintient des mémoires compactes, thématiques et cohérentes grâce à trois mécanismes clés :

  • Mémoire sensorielle pré-compressée : Filtre les tokens redondants et de faible valeur avant le stockage
  • Mémoire à court terme sensible aux sujets : Regroupe les tours par thème et les résume en unités de mémoire précises
  • Consolidation à long terme pendant le sommeil : Utilise des insertions incrémentielles en temps réel plus des mises à jour haute fidélité hors ligne sans impact sur la latence

Résultats de performance

Sur le benchmark LongMemEval, LightMem montre :

  • Amélioration de la précision : jusqu'à ~10,9 %
  • Réduction des tokens : jusqu'à 117 fois
  • Réduction des appels API : jusqu'à 159 fois
  • Réduction du temps d'exécution : >12 fois
Ad

Mises à jour et fonctionnalités récentes

  • Cadre d'évaluation de référence pour les systèmes de mémoire (Mem0, A-MEM, LangMem) sur LoCoMo et LongMemEval
  • Vidéo de démonstration et notebooks de tutoriel pour plusieurs scénarios
  • Intégration du serveur MCP pour l'invocation de mémoire multi-outils
  • Support complet du jeu de données LoCoMo
  • Intégration de GLM-4.6 avec des scripts reproductibles
  • Déploiement local via Ollama, vLLM, Transformers avec capacité de chargement automatique

Positionnement et cas d'utilisation

LightMem est conçu comme une couche mémoire modulaire qui peut s'intégrer à diverses piles d'agents, notamment :

  • Agents à contexte long
  • Agents utilisant des outils
  • Flux de travail autonomes
  • Systèmes conversationnels

Le système fournit une mémoire structurée qui évolue sans explosion du nombre de tokens, ce qui le rend particulièrement utile pour les développeurs travaillant avec des frameworks d'agents, des systèmes de mémoire/RAG, des modèles à contexte long et des équipes LLM appliquées.

Disponibilité

Article : https://arxiv.org/abs/2510.18866

Code : https://github.com/zjunlp/LightMem

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

🦀
Tools

Taxe de compétence Claude Code : 2 596 compétences installées, 40 utilisées, 91 $/mois gaspillés

Chaque compétence installée de Claude Code est chargée dans le prompt système de chaque session. Un utilisateur a mesuré 102 651 jetons chargés par session avec 98,6 % jamais utilisés, coûtant environ 91 $/mois. Un outil open-source, skill-tax, audite l'utilisation et le coût.

OpenClawRadar
Approche de l'amélioration autonome de la mémoire dans les agents d'IA locaux
Tools

Approche de l'amélioration autonome de la mémoire dans les agents d'IA locaux

Un développeur partage son approche de la mémoire persistente pour les agents d'IA locaux en utilisant des fichiers markdown comme source de vérité, l'évaluation d'épisodes avec des règles basées sur la confiance, et l'augmentation de la confiance basée sur les modèles d'approbation.

OpenClawRadar
Biais Logit Toroïdal : Une Astuce Simple au Moment de l'Inférence Réduit les Hallucinations de 40 %
Tools

Biais Logit Toroïdal : Une Astuce Simple au Moment de l'Inférence Réduit les Hallucinations de 40 %

Une nouvelle méthode projette les tokens sur un tore et amplifie les logits voisins, réduisant les erreurs factuelles sans fine-tuning ni RAG.

OpenClaw Radar
Débloquer la proactivité : Une exploration approfondie des innovations Clawbot par la communauté
Tools

Débloquer la proactivité : Une exploration approfondie des innovations Clawbot par la communauté

Découvrez comment les passionnés améliorent la proactivité de leur Clawbot grâce à des stratégies inventives et des idées issues de la communauté. Un aperçu des discussions et révélations de r/openclaw.

OpenClawRadar