Memento v1.0 : Mémoire persistante locale pour les agents d'IA de codage

Ce que fait Memento v1.0
Memento v1.0 fournit une couche de mémoire persistante locale pour les agents d'IA de codage. Tout s'exécute sur votre machine — embeddings, stockage et recherche — sans nécessiter de cloud ni de clés API après la configuration.
Détails techniques clés
Embeddings : Utilise all-MiniLM-L6-v2 via @xenova/transformers (384 dimensions) fonctionnant entièrement hors ligne. Embeddings cloud optionnels via variables d'environnement pour OpenAI (text-embedding-3-small) ou Gemini (embedding-001).
Stockage : JSON local + index HNSW par défaut. Prise en charge optionnelle de ChromaDB ou Neo4j.
Recherche : Index HNSW pour la recherche approximative des plus proches voisins (<50ms sur 2000+ mémoires). Implémentation complète de BM25 avec k1=1.2, b=0.75 pour la recherche par mots-clés. Mode hybride combinant 70% de similarité cosinus + 30% BM25.
Déduplication : SHA-256 + seuil de similarité cosinus de 0,92.
Fonctionnalités de résilience : Disjoncteur, journalisation anticipée, cache LRU.
Gestion de la mémoire : Décroissance exponentielle sur 347 jours pour les scores d'importance.
Configuration et utilisation
Installer avec : npx memento-memory setup
Outil de migration : memory_migrate ré-embarque l'intégralité de votre stock lors du changement de fournisseur d'embeddings — aucune perte de données.
Prise en charge des IDE et outils
Compatibilité multi-IDE : Claude Code, Cursor, Windsurf, OpenCode — tous partagent le même stock local.
17 outils MCP pour sauvegarder/rappel/recherche/export/import/ingestion/compaction/graphe/cycle de vie des sessions.
Confidentialité et licence
Zéro télémétrie — vos décisions architecturales et modèles de code ne quittent jamais votre machine. Fonctionne sans internet après configuration. Sous licence AGPL-3.0 et auto-hébergeable en une commande.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Codev : Flux de travail de l'agent IA pour 106 PR en 14 jours
Codev est un système open-source qui coordonne plusieurs agents d'IA grâce à un flux de travail strict Spécification → Plan → Implémentation → Revue → PR, détectant 20 bogues avant la mise en production et produisant un code noté 1,2 point de mieux sur une échelle de 10 points.

Agent de revue PR open source PrixAI détecte 10/10 bugs plantés à un coût 6 fois inférieur à CodeRabbit
Un utilisateur de Reddit a créé PrixAI, un agent de revue de code open source qui utilise des modèles d'inférence locaux/peu coûteux pour égaler les fonctionnalités de CodeRabbit à un coût 6 fois moindre, détectant les 10 problèmes intentionnellement plantés dans une PR de test.

Mia : Démon d'espace de travail IA local avec application Android native et diffusion P2P
Mia est un démon qui s'exécute sur votre machine et s'associe à une application Android native via P2P, vous permettant de lancer et de surveiller des tâches de codage IA de longue durée depuis votre téléphone. Il prend en charge les agents OpenCode, Claude Code, Gemini CLI et Codex, diffusant la sortie directement sur votre appareil en temps réel.

Discussion Reddit : Les fichiers Identity.md sont insuffisants pour la stabilité de la personnalité des employés IA sans une architecture de modèle appropriée.
Une discussion sur Reddit soutient que l'ajustement des fichiers identity.md pour prévenir la contamination de personnalité dans les équipes d'employés IA est inefficace si l'architecture sous-jacente du modèle ne fait que simuler la séparation des rôles. Le post recommande d'utiliser le backend Minimax M2.7, qui a intégré la conscience des limites directement dans l'entraînement de base à travers plus de 100 cycles d'auto-évolution.