SDK de Memoria Engram: Memoria Basada en Grafos para Agentes de IA con Modelos Locales

SDK de Memoria de Grafos para Modelos de IA Locales
Engram Memory SDK es un sistema de memoria de grafos de código abierto diseñado para agentes de IA que funciona con modelos locales mediante la integración de LiteLLM. La arquitectura central separa la ingesta de la recuperación: solo necesitas el LLM una vez durante la ingesta para extraer entidades y relaciones, mientras que la recuperación opera mediante búsqueda vectorial pura, recorrido de grafos y puntuación sin requerir llamadas adicionales al LLM.
Detalles Técnicos
El SDK está construido con Python asíncrono y utiliza Neo4j como su base de datos backend. Según la fuente, promedia ~735 tokens por operación de ingesta y logra una latencia de recuperación de 95ms. El sistema incluye funciones de memoria de auto-reestructuración con descomposición y agrupamiento ejecutándose en segundo plano.
Configuración e Instalación
La instalación es sencilla:
pip install engram-memory-sdkLa configuración requiere un archivo .env con estas variables:
LLM_MODEL=ollama/llama3 # o cualquier modelo local compatible con LiteLLM
NEO4J_URI=bolt://localhost:7687El sistema admite cualquier modelo a través de LiteLLM, incluyendo implementaciones locales mediante Ollama, vLLM y text-generation-webui. La ventaja clave es la eficiencia de costos: con un pequeño modelo local manejando la extracción, las operaciones de recuperación continuas tienen literalmente un costo de $0 ya que no consumen tokens del LLM.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

El Framework AutoAgents Rust Agrega Enlaces de Python para Prototipado
AutoAgents, un framework multiagente basado en Rust, ahora tiene enlaces para Python que permiten a los desarrolladores prototipar en Python mientras mantienen el mismo núcleo de ejecución en Rust, las interfaces de proveedores, el modelo de canalización y la semántica de agentes. Los enlaces permiten experimentar con modelos de IA locales sin sistemas externos.

Habilidades de Investigación Académica para Claude Code: Un Flujo de Trabajo Humano en el Ciclo para la Redacción de Artículos
Academic Research Skills (ARS) v3.7.0+ es un plugin para Claude Code que automatiza la búsqueda de referencias, el formateo de citas, la verificación de datos y la revisión de consistencia lógica, manteniendo al investigador humano al mando. Instálalo a través de /plugin marketplace add Imbad0202/academic-research-skills.

nah: Un guardia de permisos sensible al contexto para Claude Code
nah es un gancho PreToolUse que intercepta cada llamada a herramienta en Claude Code, clasificando comandos por tipo de acción como filesystem_read o git_history_rewrite y aplicando políticas basadas en el contexto. Ejecuta un clasificador determinista en milisegundos con escalamiento opcional a LLM para casos ambiguos.

Jan-Code-4B: Un Modelo Liviano Ajustado para Código para Desarrollo Local
El equipo de Jan lanzó Jan-Code-4B, un modelo ajustado para código de 4B parámetros basado en Jan-v3-4B-base-instruct. Está diseñado como un reemplazo directo para Haiku en Claude Code, ofreciendo una asistencia de codificación mejorada mientras se ejecuta localmente.