Memento v1.0 : Mémoire persistante locale pour les agents d'IA de codage

✍️ OpenClawRadar📅 Publié: March 24, 2026🔗 Source
Memento v1.0 : Mémoire persistante locale pour les agents d'IA de codage
Ad

Ce que fait Memento v1.0

Memento v1.0 fournit une couche de mémoire persistante locale pour les agents d'IA de codage. Tout s'exécute sur votre machine — embeddings, stockage et recherche — sans nécessiter de cloud ni de clés API après la configuration.

Détails techniques clés

Embeddings : Utilise all-MiniLM-L6-v2 via @xenova/transformers (384 dimensions) fonctionnant entièrement hors ligne. Embeddings cloud optionnels via variables d'environnement pour OpenAI (text-embedding-3-small) ou Gemini (embedding-001).

Stockage : JSON local + index HNSW par défaut. Prise en charge optionnelle de ChromaDB ou Neo4j.

Recherche : Index HNSW pour la recherche approximative des plus proches voisins (<50ms sur 2000+ mémoires). Implémentation complète de BM25 avec k1=1.2, b=0.75 pour la recherche par mots-clés. Mode hybride combinant 70% de similarité cosinus + 30% BM25.

Déduplication : SHA-256 + seuil de similarité cosinus de 0,92.

Fonctionnalités de résilience : Disjoncteur, journalisation anticipée, cache LRU.

Gestion de la mémoire : Décroissance exponentielle sur 347 jours pour les scores d'importance.

Ad

Configuration et utilisation

Installer avec : npx memento-memory setup

Outil de migration : memory_migrate ré-embarque l'intégralité de votre stock lors du changement de fournisseur d'embeddings — aucune perte de données.

Prise en charge des IDE et outils

Compatibilité multi-IDE : Claude Code, Cursor, Windsurf, OpenCode — tous partagent le même stock local.

17 outils MCP pour sauvegarder/rappel/recherche/export/import/ingestion/compaction/graphe/cycle de vie des sessions.

Confidentialité et licence

Zéro télémétrie — vos décisions architecturales et modèles de code ne quittent jamais votre machine. Fonctionne sans internet après configuration. Sous licence AGPL-3.0 et auto-hébergeable en une commande.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Codev : Flux de travail de l'agent IA pour 106 PR en 14 jours
Tools

Codev : Flux de travail de l'agent IA pour 106 PR en 14 jours

Codev est un système open-source qui coordonne plusieurs agents d'IA grâce à un flux de travail strict Spécification → Plan → Implémentation → Revue → PR, détectant 20 bogues avant la mise en production et produisant un code noté 1,2 point de mieux sur une échelle de 10 points.

OpenClawRadar
Agent de revue PR open source PrixAI détecte 10/10 bugs plantés à un coût 6 fois inférieur à CodeRabbit
Tools

Agent de revue PR open source PrixAI détecte 10/10 bugs plantés à un coût 6 fois inférieur à CodeRabbit

Un utilisateur de Reddit a créé PrixAI, un agent de revue de code open source qui utilise des modèles d'inférence locaux/peu coûteux pour égaler les fonctionnalités de CodeRabbit à un coût 6 fois moindre, détectant les 10 problèmes intentionnellement plantés dans une PR de test.

OpenClawRadar
Mia : Démon d'espace de travail IA local avec application Android native et diffusion P2P
Tools

Mia : Démon d'espace de travail IA local avec application Android native et diffusion P2P

Mia est un démon qui s'exécute sur votre machine et s'associe à une application Android native via P2P, vous permettant de lancer et de surveiller des tâches de codage IA de longue durée depuis votre téléphone. Il prend en charge les agents OpenCode, Claude Code, Gemini CLI et Codex, diffusant la sortie directement sur votre appareil en temps réel.

OpenClawRadar
Discussion Reddit : Les fichiers Identity.md sont insuffisants pour la stabilité de la personnalité des employés IA sans une architecture de modèle appropriée.
Tools

Discussion Reddit : Les fichiers Identity.md sont insuffisants pour la stabilité de la personnalité des employés IA sans une architecture de modèle appropriée.

Une discussion sur Reddit soutient que l'ajustement des fichiers identity.md pour prévenir la contamination de personnalité dans les équipes d'employés IA est inefficace si l'architecture sous-jacente du modèle ne fait que simuler la séparation des rôles. Le post recommande d'utiliser le backend Minimax M2.7, qui a intégré la conscience des limites directement dans l'entraînement de base à travers plus de 100 cycles d'auto-évolution.

OpenClawRadar