SDK de Memória Engram: Memória Baseada em Grafos para Agentes de IA com Modelos Locais

SDK de Memória em Grafo para Modelos Locais de IA
Engram Memory SDK é um sistema de memória em grafo de código aberto projetado para agentes de IA que funciona com modelos locais através da integração LiteLLM. A arquitetura principal separa a ingestão da recuperação: você só precisa do LLM uma vez durante a ingestão para extrair entidades e relacionamentos, enquanto a recuperação opera através de busca vetorial pura, travessia de grafo e pontuação sem exigir chamadas adicionais de LLM.
Detalhes Técnicos
O SDK é construído com Python assíncrono e usa Neo4j como seu banco de dados de backend. De acordo com a fonte, ele tem uma média de ~735 tokens por operação de ingestão e alcança 95ms de latência de recuperação. O sistema inclui recursos de memória de auto-reestruturação com decaimento e agrupamento executando em segundo plano.
Configuração e Instalação
A instalação é simples:
pip install engram-memory-sdkA configuração requer um arquivo .env com estas variáveis:
LLM_MODEL=ollama/llama3 # ou qualquer modelo local suportado pelo LiteLLM
NEO4J_URI=bolt://localhost:7687O sistema suporta qualquer modelo via LiteLLM, incluindo implantações locais através de Ollama, vLLM e text-generation-webui. A vantagem principal é a eficiência de custo: com um pequeno modelo local lidando com a extração, as operações contínuas de recuperação têm literalmente custo $0, pois não consomem tokens de LLM.
📖 Read the full source: r/LocalLLaMA
👀 See Also

AgentConnex: Um Mercado para Descoberta e Reputação de Agentes de IA
AgentConnex é um mercado onde agentes de IA se registram via API, constroem reputação através da conclusão de trabalhos e avaliações, e permitem que desenvolvedores os descubram e contratem. Atualmente, possui aproximadamente 570 agentes nas áreas de programação, pesquisa, segurança, DevOps e conteúdo.

DeepClaude substitui o backend Anthropic do Claude Code pelo DeepSeek V4 Pro com custo 17 vezes menor
Um script que reescreve as variáveis de ambiente do Claude Code para rotear todas as chamadas do loop do agente através do DeepSeek V4 Pro, OpenRouter ou Fireworks AI — mesma experiência de usuário, $0,87/M tokens de saída vs $15/M.

Coordenador de Servidor para Desenvolvimento Multi-Agente Evita Sobrescritas
Um desenvolvedor criou um servidor coordenador em Node.js que gerencia bloqueio de intervalos de linhas, rastreamento de deslocamento de linhas e mensagens em tempo real entre agentes de IA trabalhando na mesma base de código. O sistema evita que os agentes sobrescrevam o trabalho uns dos outros usando bloqueio baseado em HTTP com detecção de conflitos.

Fora da Rede: Utilizando o Hardware do Telefone para Aplicações de IA Offline
Off Grid é um aplicativo de código aberto que usa o hardware do seu telefone para tarefas de IA offline, como geração de texto e transcrição de voz.