에이전트메모리 V4는 LongMemEval 벤치마크에서 96.2%를 달성하며, 상용 AI 메모리 시스템을 능가했습니다.

agentmemory V4는 AI 에이전트를 위한 오픈소스 메모리 시스템으로, 장기 AI 에이전트 메모리의 표준 벤치마크인 LongMemEval에서 세계 기록인 96.2%의 점수를 달성했습니다.
벤치마크 성능
이 시스템은 여러 자금 지원을 받은 AI 메모리 회사들을 능가했습니다:
- PwC Chronos: 95.6%
- Mastra: 94.87%
- OMEGA: 93.2% (원본)
- Supermemory: 85.86%
- Emergence AI: 86%
- Zep: 71.2%
개발 세부사항
중급 게이밍 PC(i3-12100F)에서 16일 동안 단독으로 개발되었으며, 총 비용은 1,000달러입니다. 이 시스템은 Claude Opus를 생성기로, GPT-4o를 판단기로 사용하지만, 검색 아키텍처가 핵심 혁신입니다.
기술 아키텍처
이 시스템은 단일 SQLite 기반 시스템에서 여러 검색 기술을 결합합니다:
- HNSW(계층적 탐색 가능 소규모 세계)를 통한 근사 최근접 이웃 검색
- 기존 텍스트 검색을 위한 BM25
- 관련성 점수화를 위한 교차 인코더
- 지식 그래프 통합
- 시간 인식 메모리 검색을 위한 시간적 기반
사용 가능성
이 시스템은 MIT 라이선스 하에 오픈소스로 제공되며, 다음에서 이용할 수 있습니다: github.com/JordanMcCann/agentmemory
📖 Read the full source: r/LocalLLaMA
👀 See Also

OpenClaw 공유 메모리 플러그인: SQLite 기반 다중 에이전트 조정
한 개발자가 OpenClaw 다중 에이전트 설정을 위한 플러그인을 개발하여, 에이전트들이 SQLite를 사용해 메모리를 공유할 수 있도록 하여 외부 서비스 필요성을 제거했습니다. 이 플러그인은 도구를 통한 명시적 메모리 공유, 자동 컨텍스트 추출, 접근 제어, 엔티티 추적, 모순 감지 기능을 제공합니다.

스킬 스튜디오: Claude AI 에이전트 스킬 관리를 위한 오픈소스 데스크톱 애플리케이션
Skill Studio는 개발자가 커뮤니티 스킬 저장소를 탐색하고, 마크다운 렌더링으로 문서를 미리 보고, npx skills add와 같은 원클릭 명령어로 스킬을 설치할 수 있는 무료 오픈소스 macOS 데스크톱 앱입니다.

Claude Code + MCP가 소스 코드에서 테스트 스위트를 생성합니다
Claude Code는 소스 코드를 분석하여 모듈, 기능, 시나리오, 정상 경로, 경계 사례 및 오류 처리를 포함하는 계층적 테스트 스위트를 생성한 다음 MCP를 통해 테스트 관리 시스템으로 푸시합니다.

Claude-File-Recovery: Claude Code 세션 기록에서 파일을 추출하는 CLI 도구
claude-file-recovery는 Python CLI 도구이자 TUI로, Claude Code가 생성, 수정 또는 읽은 파일을 복구하기 위해 ~/.claude/projects/의 JSONL 세션 기록을 파싱하며, 파일의 이전 버전을 특정 시점으로 복구하는 기능을 포함합니다.