Memento v1.0 : Mémoire locale IA pour agents de codage sans cloud

Ce que fait Memento v1.0

Memento v1.0 fournit une couche de mémoire persistante locale pour les agents d'IA de codage. Tout s'exécute sur votre machine — embeddings, stockage et recherche — sans nécessiter de cloud ni de clés API après la configuration.

Détails techniques clés

Embeddings : Utilise all-MiniLM-L6-v2 via @xenova/transformers (384 dimensions) fonctionnant entièrement hors ligne. Embeddings cloud optionnels via variables d'environnement pour OpenAI (text-embedding-3-small) ou Gemini (embedding-001).

Stockage : JSON local + index HNSW par défaut. Prise en charge optionnelle de ChromaDB ou Neo4j.

Recherche : Index HNSW pour la recherche approximative des plus proches voisins (<50ms sur 2000+ mémoires). Implémentation complète de BM25 avec k1=1.2, b=0.75 pour la recherche par mots-clés. Mode hybride combinant 70% de similarité cosinus + 30% BM25.

Déduplication : SHA-256 + seuil de similarité cosinus de 0,92.

Fonctionnalités de résilience : Disjoncteur, journalisation anticipée, cache LRU.

Gestion de la mémoire : Décroissance exponentielle sur 347 jours pour les scores d'importance.

Configuration et utilisation

Installer avec : npx memento-memory setup

Outil de migration : memory_migrate ré-embarque l'intégralité de votre stock lors du changement de fournisseur d'embeddings — aucune perte de données.

Prise en charge des IDE et outils

Compatibilité multi-IDE : Claude Code, Cursor, Windsurf, OpenCode — tous partagent le même stock local.

17 outils MCP pour sauvegarder/rappel/recherche/export/import/ingestion/compaction/graphe/cycle de vie des sessions.

Confidentialité et licence

Zéro télémétrie — vos décisions architecturales et modèles de code ne quittent jamais votre machine. Fonctionne sans internet après configuration. Sous licence AGPL-3.0 et auto-hébergeable en une commande.

📖 Read the full source: r/LocalLLaMA