오픈소스 LLM 에이전트 메모리 시스템, 벤치마크에서 높은 점수 달성

공개 벤치마크를 갖춘 LLM 에이전트 메모리 시스템
한 개발자가 Claude Code와 OpenClaw를 위한 지속적 메모리 시스템을 구축하여 LLM 에이전트에게 세션 간 실제 문맥 연속성을 제공합니다. 이 시스템은 LoCoMo 벤치마크에서 90.8%(모든 공개 시스템을 능가), LongMemEval에서 89.1%의 점수를 달성했습니다.
아키텍처 및 프레임워크 호환성
아키텍처는 어댑터 기반으로, 현재 생명주기 이벤트에 연결되지만 핵심 구성요소(저장, 검색, 인텔리전스)는 프레임워크 독립적입니다. 검색 파이프라인은 FTS5, Qdrant KNN, 최신성, 그래프 탐색을 포함한 4채널 RRF 방식을 사용합니다. 인텔리전스 계층에는 의도 분류, 경험 패턴, 모든 에이전트 프레임워크에 연결 가능한 RL 정책 구성요소가 포함됩니다.
설정 및 기술 스택
빠른 설정을 위해 다음이 필요합니다:
ollama pull snowflake-arctic-embed2
bun install && bun run build && bun run setup
node dist/angel/index.cjs기술 스택에는 TypeScript, SQLite(better-sqlite3), Qdrant, Ollama, esbuild, Vitest가 포함됩니다.
주요 설계 결정
- SQLite를 진실 소스로, Qdrant를 가속화용으로 사용하는 이중 기록 시스템과 우아한 성능 저하 처리
- 모든 작업이 예외를 발생시키지 않음 — 개별 실패가 파이프라인을 중단시키지 않음
- 밀리초 수명의 임시 훅(캡처용)과 지속적 Angel(반성용)
- RL 정책 모델은 순수 TypeScript로 구현(Float32Array 수학 연산, PyTorch 없음)
- 백그라운드에서 콘텐츠 길이를 고려한 임베딩 백필
이 프로젝트는 29,000줄의 코드, 1,968개의 테스트를 포함하며, https://github.com/grigorijejakisic/Claudex에서 MIT 라이선스로 제공됩니다.
📖 Read the full source: r/openclaw
👀 See Also

Claude Code 세션 대시보드: 다중 세션 모니터링을 위한 오픈소스 도구
여러 개의 Claude Code 세션을 동시에 모니터링하는 오픈소스 대시보드로, 토큰 사용량, 비용, 세션 상태, 컨텍스트 창 사용량, 활성 서브에이전트를 보여줍니다. 설치에는 세 가지 명령어가 필요합니다: git clone, cd, npm install && npm start.

걸리버 여행 앱, 원격 MCP 서버를 통해 Claude와 통합
한 개발자가 여행 계획 앱 'Gullivr'을 만들었습니다. 이 앱은 원격 MCP 서버를 통해 Claude와 통합되어, Claude가 앱 내에서 직접 여행을 생성하고 관리할 수 있게 합니다. 이 통합은 Claude와 채팅하는 동안 실시간 업데이트를 가능하게 하여, 도구 간에 수동으로 복사하는 번거로움을 없앱니다.

듀얼 모델 아키텍처는 긴 대화에서 토큰 소비를 절반으로 줄입니다.
한 개발자가 소형 '잠재의식' 모델이 배경에서 대화 기록을 압축하는 이중 모델 시스템을 구축하여 주 모델이 원시 기록 120K 토큰 대신 선별된 ~35K 컨텍스트로 작업할 수 있게 했습니다. 이 아키텍처는 지속적인 프로젝트 작업에서 토큰 소비를 약 절반으로 줄입니다.

그래피파이: 리포지토리의 지식 그래프를 구축한 클로드 코드 스킬 — 26일 만에 45만 다운로드, 4만 별
Graphify는 저장소의 모든 파일을 읽고 Leiden 커뮤니티 탐지로 지식 그래프를 구축한 후, 원시 파일보다 71배 적은 토큰으로 쿼리하는 Claude Code 스킬입니다. PyPI 다운로드 450k+회, GitHub 스타 약 40k개, 첫 주 글로벌 랭킹 2위.