SDK Mémoire Engram : Mémoire basée sur des graphes pour agents IA avec modèles locaux

✍️ OpenClawRadar📅 Publié: April 14, 2026🔗 Source

SDK de Mémoire Graphique pour Modèles d'IA Locaux

Engram Memory SDK est un système de mémoire graphique open-source conçu pour les agents d'IA qui fonctionne avec des modèles locaux via l'intégration LiteLLM. L'architecture principale sépare l'ingestion de la récupération : vous n'avez besoin du LLM qu'une seule fois pendant l'ingestion pour extraire les entités et les relations, tandis que la récupération fonctionne par recherche vectorielle pure, parcours de graphe et notation sans nécessiter d'appels LLM supplémentaires.

Détails Techniques

Le SDK est construit avec Python asynchrone et utilise Neo4j comme base de données backend. Selon la source, il moyenne environ ~735 tokens par opération d'ingestion et atteint une latence de récupération de 95ms. Le système inclut des fonctionnalités d'auto-restructuration de la mémoire avec décroissance et regroupement fonctionnant en arrière-plan.

Configuration et Installation

L'installation est simple :

pip install engram-memory-sdk

La configuration nécessite un fichier .env avec ces variables :

LLM_MODEL=ollama/llama3 # ou tout modèle local pris en charge par LiteLLM
NEO4J_URI=bolt://localhost:7687

Le système prend en charge n'importe quel modèle via LiteLLM, y compris les déploiements locaux via Ollama, vLLM et text-generation-webui. L'avantage clé est l'efficacité des coûts : avec un petit modèle local gérant l'extraction, les opérations de récupération en cours ont littéralement un coût de 0 $ puisqu'elles ne consomment pas de tokens LLM.

📖 Read the full source: r/LocalLLaMA

👀 See Also

Tools

120 modèles de prompts testés : 8 fonctionnent vraiment pour Claude Code

Un test empirique de 3 mois sur 120 modèles de prompt pour Claude Code donne 8 commandes exploitables et 5 prompts de validation. Modèles clés : L99 (réduit les hésitations), /ghost (supprime la voix IA), OODA (raisonnement structuré), ULTRATHINK (raisonnement profond), HARDMODE (débogage par contraintes).

May 8, 2026, 10:17 AM UTC

OpenClawRadar

Tools

Un sorcier gratuit migre l'historique de ChatGPT vers les projets Claude — Leçons clés sur les limites de jetons et la RAG

Un outil gratuit, sans code, importe les exports ChatGPT dans les Projets Claude, révélant qu'un JSON de 26 Mo atteint les limites de tokens et que la division par sujet est la solution. Le RAG de Claude ne lit que des parties des fichiers volumineux, donc les requêtes spécifiques fonctionnent mieux.

Apr 30, 2026, 02:17 PM UTC

OpenClawRadar

Tools

TradesMCP : Serveur MCP Open Source pour la Vérification des Licences de Contractants et les Données de Construction

TradesMCP est un serveur Model Context Protocol open source qui fournit à Claude un accès à des données réelles de licences d'entrepreneurs, de permis de construire, de prix des matériaux et de taux de main-d'œuvre. L'outil a correctement vérifié une licence d'entrepreneur active en Californie, là où ChatGPT a renvoyé des informations incorrectes.

Apr 13, 2026, 06:46 PM UTC

OpenClawRadar

Tools

Utiliser un LLM local comme sous-agent de code Claude pour réduire l'utilisation du contexte

Un développeur partage une méthode pour utiliser Claude Code afin de déléguer des tâches à un LLM local via l'API de LM Studio, en gardant le contenu des fichiers hors du contexte de Claude. L'approche utilise un script Python d'environ 120 lignes avec des appels d'outils pour lire les fichiers localement et renvoyer des résumés.

Mar 2, 2026, 11:45 AM UTC

OpenClawRadar