오픈소스 LLM 메모리 시스템, LoCoMo 90.8%·LongMemEval 89.1% 달성

공개 벤치마크를 갖춘 LLM 에이전트 메모리 시스템

한 개발자가 Claude Code와 OpenClaw를 위한 지속적 메모리 시스템을 구축하여 LLM 에이전트에게 세션 간 실제 문맥 연속성을 제공합니다. 이 시스템은 LoCoMo 벤치마크에서 90.8%(모든 공개 시스템을 능가), LongMemEval에서 89.1%의 점수를 달성했습니다.

아키텍처 및 프레임워크 호환성

아키텍처는 어댑터 기반으로, 현재 생명주기 이벤트에 연결되지만 핵심 구성요소(저장, 검색, 인텔리전스)는 프레임워크 독립적입니다. 검색 파이프라인은 FTS5, Qdrant KNN, 최신성, 그래프 탐색을 포함한 4채널 RRF 방식을 사용합니다. 인텔리전스 계층에는 의도 분류, 경험 패턴, 모든 에이전트 프레임워크에 연결 가능한 RL 정책 구성요소가 포함됩니다.

설정 및 기술 스택

빠른 설정을 위해 다음이 필요합니다:

ollama pull snowflake-arctic-embed2
bun install && bun run build && bun run setup
node dist/angel/index.cjs

기술 스택에는 TypeScript, SQLite(better-sqlite3), Qdrant, Ollama, esbuild, Vitest가 포함됩니다.

주요 설계 결정

SQLite를 진실 소스로, Qdrant를 가속화용으로 사용하는 이중 기록 시스템과 우아한 성능 저하 처리
모든 작업이 예외를 발생시키지 않음 — 개별 실패가 파이프라인을 중단시키지 않음
밀리초 수명의 임시 훅(캡처용)과 지속적 Angel(반성용)
RL 정책 모델은 순수 TypeScript로 구현(Float32Array 수학 연산, PyTorch 없음)
백그라운드에서 콘텐츠 길이를 고려한 임베딩 백필

이 프로젝트는 29,000줄의 코드, 1,968개의 테스트를 포함하며, https://github.com/grigorijejakisic/Claudex에서 MIT 라이선스로 제공됩니다.

📖 Read the full source: r/openclaw

오픈소스 LLM 에이전트 메모리 시스템, 벤치마크에서 높은 점수 달성

공개 벤치마크를 갖춘 LLM 에이전트 메모리 시스템

아키텍처 및 프레임워크 호환성

설정 및 기술 스택

주요 설계 결정

👀 See Also

ARP: 자율 에이전트 통신을 위한 무상태 웹소켓 릴레이

포지: 오픈소스 클로드 코드 플러그인에 거버넌스 및 테스트 게이트 추가

이벤트 호라이즌 VS 코드 확장 기능, 다중 AI 에이전트를 위한 파일 잠금 및 작업 계획 조정 기능 추가

MTPLX: 네이티브 MTP 헤드를 사용한 Apple Silicon에서 2.24배 더 빠른 토큰