SDK Mémoire Engram : Mémoire basée sur des graphes pour agents IA avec modèles locaux

SDK de Mémoire Graphique pour Modèles d'IA Locaux
Engram Memory SDK est un système de mémoire graphique open-source conçu pour les agents d'IA qui fonctionne avec des modèles locaux via l'intégration LiteLLM. L'architecture principale sépare l'ingestion de la récupération : vous n'avez besoin du LLM qu'une seule fois pendant l'ingestion pour extraire les entités et les relations, tandis que la récupération fonctionne par recherche vectorielle pure, parcours de graphe et notation sans nécessiter d'appels LLM supplémentaires.
Détails Techniques
Le SDK est construit avec Python asynchrone et utilise Neo4j comme base de données backend. Selon la source, il moyenne environ ~735 tokens par opération d'ingestion et atteint une latence de récupération de 95ms. Le système inclut des fonctionnalités d'auto-restructuration de la mémoire avec décroissance et regroupement fonctionnant en arrière-plan.
Configuration et Installation
L'installation est simple :
pip install engram-memory-sdkLa configuration nécessite un fichier .env avec ces variables :
LLM_MODEL=ollama/llama3 # ou tout modèle local pris en charge par LiteLLM
NEO4J_URI=bolt://localhost:7687Le système prend en charge n'importe quel modèle via LiteLLM, y compris les déploiements locaux via Ollama, vLLM et text-generation-webui. L'avantage clé est l'efficacité des coûts : avec un petit modèle local gérant l'extraction, les opérations de récupération en cours ont littéralement un coût de 0 $ puisqu'elles ne consomment pas de tokens LLM.
📖 Read the full source: r/LocalLLaMA
👀 See Also

htmLLM-124M v2 publié : Modèle d'autocomplétion HTML/Bootstrap spécialisé
LH-Tech-AI a publié htmLLM-124M v2, un modèle de 124 millions de paramètres spécialisé dans l'autocomplétion HTML/Bootstrap qui atteint une perte de validation de 0,91 et s'entraîne en ~8 heures sur une seule GPU T4.

clarp : Alternative Open Source Gratuite à Claude -p Avant la Tarification au Compteur du 15 Juin
Claude -p passe à la facturation à l'usage le 15 juin. clarp est un CLI open source qui le remplace pour les workflows locaux — il suffit de changer le nom du binaire de claude à clarp.

Eä : Un compilateur SIMD pour Python écrit en Rust
Un développeur a créé Eä, un compilateur pour les noyaux SIMD en ~12 000 lignes de Rust qui génère des bibliothèques partagées et des wrappers Python à partir de fichiers .ea, obtenant des accélérations de 6,6× par rapport à NumPy sans ctypes ni systèmes de build.

Personnaliser Claude IA pour un retour amélioré
Ajustez les paramètres de Claude IA pour éviter un accord excessif et favoriser une réflexion plus critique et des retours plus pratiques.