SDK de Memoria Engram: Memoria Basada en Grafos para Agentes de IA con Modelos Locales

✍️ OpenClawRadar📅 Publicado: 14 de abril de 2026🔗 Source

SDK de Memoria de Grafos para Modelos de IA Locales

Engram Memory SDK es un sistema de memoria de grafos de código abierto diseñado para agentes de IA que funciona con modelos locales mediante la integración de LiteLLM. La arquitectura central separa la ingesta de la recuperación: solo necesitas el LLM una vez durante la ingesta para extraer entidades y relaciones, mientras que la recuperación opera mediante búsqueda vectorial pura, recorrido de grafos y puntuación sin requerir llamadas adicionales al LLM.

Detalles Técnicos

El SDK está construido con Python asíncrono y utiliza Neo4j como su base de datos backend. Según la fuente, promedia ~735 tokens por operación de ingesta y logra una latencia de recuperación de 95ms. El sistema incluye funciones de memoria de auto-reestructuración con descomposición y agrupamiento ejecutándose en segundo plano.

Configuración e Instalación

La instalación es sencilla:

pip install engram-memory-sdk

La configuración requiere un archivo .env con estas variables:

LLM_MODEL=ollama/llama3 # o cualquier modelo local compatible con LiteLLM
NEO4J_URI=bolt://localhost:7687

El sistema admite cualquier modelo a través de LiteLLM, incluyendo implementaciones locales mediante Ollama, vLLM y text-generation-webui. La ventaja clave es la eficiencia de costos: con un pequeño modelo local manejando la extracción, las operaciones de recuperación continuas tienen literalmente un costo de $0 ya que no consumen tokens del LLM.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Herramientas

MAGELLAN: Un sistema autónomo de descubrimiento científico con 15 agentes construido sobre Claude Code

MAGELLAN es un sistema de descubrimiento científico autónomo de 15 agentes construido completamente en Claude Code. Utiliza Opus para razonamiento profundo y Sonnet para tareas estructuradas, generando hipótesis interdisciplinarias sin dirección humana, con 260 hipótesis propuestas y 60% eliminadas por validación adversaria en 19 sesiones.

30 mar 2026, 04:45 UTC

OpenClawRadar

Herramientas

La Reutilización de la Caché KV para Conversaciones Largas en Apple Silicon Logra una Aceleración de 200 Veces

Un desarrollador implementó la reutilización de caché KV basada en sesiones para la inferencia de LLM local utilizando el framework MLX de Apple, logrando una mejora de 200x en el tiempo hasta el primer token con un contexto de 100K. El enfoque mantiene la caché KV en memoria a lo largo de los turnos de conversación, procesando solo los tokens nuevos.

15 mar 2026, 10:45 UTC

OpenClawRadar

Herramientas

OpenClaw PARA Habilidad Organiza Automáticamente Archivos Usando el Método de Tiago Forte.

Un desarrollador creó una habilidad para OpenClaw que aplica el método PARA (Proyectos, Áreas, Recursos, Archivos) para la organización automática de archivos, moviendo archivos desde un directorio raíz desordenado hacia carpetas estructuradas.

24 feb 2026, 19:45 UTC

OpenClawRadar

Herramientas

ATLAS: Marco de Aprendizaje Adaptativo en Tiempo de Prueba Supera a Claude Sonnet en Puntos de Referencia de Codificación con GPU de $500

ATLAS logra un 74,6% de aprobación@1-v(k=3) en LiveCodeBench con un modelo congelado de 14B en una única GPU de consumo, superando el 71,4% de Claude 4.5 Sonnet a una fracción del costo mediante generación basada en restricciones y refinamiento iterativo autoverificado.

27 mar 2026, 00:45 UTC

OpenClawRadar