엔그램 메모리 SDK: 로컬 모델을 위한 그래프 기반 AI 에이전트 메모리

로컬 AI 모델용 그래프 메모리 SDK
Engram Memory SDK는 LiteLLM 통합을 통해 로컬 모델과 작동하도록 설계된 AI 에이전트용 오픈소스 그래프 메모리 시스템입니다. 핵심 아키텍처는 수집과 회상을 분리합니다: 엔티티와 관계를 추출하기 위해 수집 과정에서만 LLM이 한 번 필요하며, 회상은 추가 LLM 호출 없이 순수 벡터 검색, 그래프 탐색 및 점수화를 통해 작동합니다.
기술적 세부사항
이 SDK는 비동기 Python으로 구축되었으며 백엔드 데이터베이스로 Neo4j를 사용합니다. 소스에 따르면, 평균 약 735개의 토큰을 수집 작업에 사용하며 95ms의 회상 지연 시간을 달성합니다. 시스템은 백그라운드에서 감쇠와 클러스터링을 실행하는 자체 재구조화 메모리 기능을 포함합니다.
설정 및 설치
설치는 간단합니다:
pip install engram-memory-sdk구성에는 다음 변수들이 포함된 .env 파일이 필요합니다:
LLM_MODEL=ollama/llama3 # 또는 LiteLLM이 지원하는 모든 로컬 모델
NEO4J_URI=bolt://localhost:7687이 시스템은 Ollama, vLLM, text-generation-webui를 통한 로컬 배포를 포함하여 LiteLLM을 통해 모든 모델을 지원합니다. 핵심 장점은 비용 효율성입니다: 작은 로컬 모델이 추출을 처리함으로써, 지속적인 회상 작업은 LLM 토큰을 소비하지 않기 때문에 실제로 $0의 비용이 발생합니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

어니 버디 v2.0.0, 클로드 코드 버디에 미리보기 기능 추가
Any Buddy v2.0.0는 사용자가 Claude 코드에 적용하기 전에 다양한 버디를 테스트할 수 있는 미리보기 기능을 도입했으며, Linux, Mac, Windows용 플랫폼별 수정 사항도 포함하고 있습니다. 이 도구는 출시 이후 160개의 GitHub 스타를 획득했습니다.

Zoku: 클로드 코드에서 반복되는 워크플로우를 자동으로 감지하는 도구
Zoku는 Claude Code의 이벤트 시스템에 연결하여 세션 간 도구 작업을 기록하고, 반복되는 워크플로우 패턴을 식별한 다음, Claude에게 이러한 패턴을 알려주어 사전에 제안하거나 실행할 수 있도록 하는 로컬 도구입니다. 설정이 필요하지 않으며, 의존성이 없고, 모든 데이터를 로컬(~/.zoku/)에 저장합니다.

모듈러스: AI 코딩 에이전트를 위한 리포지토리 간 지식 오케스트레이션
Modulus는 데스크톱 애플리케이션으로, 여러 AI 코딩 에이전트를 실행하며 저장소 간 공유 프로젝트 메모리를 제공합니다. 이 도구는 에이전트가 수동 설명 없이도 서로 다른 코드베이스 간의 의존성을 이해할 수 있게 함으로써 저장소 간 컨텍스트 문제를 해결합니다.

원격 상호 작용을 위해 채팅 앱에 Claude 코드 연결하기
cc-connect라는 GitHub 프로젝트는 Claude Code를 Slack과 Telegram 같은 메시징 플랫폼에 연결하여 로컬 머신을 노출하지 않고도 원격 상호작용을 가능하게 합니다. 에이전트는 로컬에서 실행되며 작은 브리지가 에이전트와 채팅 앱 사이에서 메시지를 중계합니다.