Pali v0.1: 재현 가능한 벤치마크를 갖춘 LLM용 오픈 소스 메모리 인프라

✍️ OpenClawRadar📅 게시일: March 14, 2026🔗 Source
Pali v0.1: 재현 가능한 벤치마크를 갖춘 LLM용 오픈 소스 메모리 인프라
Ad

Pali란 무엇인가

Pali는 인프라를 우선시하는 LLM용 오픈 소스 메모리 인프라입니다. Go로 구축되어 단일 바이너리로 즉시 사용 가능하며, qdrant, neo4j, ollama, openrouter와 같은 플러그 앤 플레이 부착물에 대한 구성이 포함되어 있습니다. 이 프로젝트는 MIT 라이선스로 제공되며 완전히 자체 호스팅이 가능합니다.

주요 기능

  • 테넌트 범위 격리를 갖춘 다중 테넌트 메모리 API
  • 어휘적, 밀집, 융합, 재순위 및 선택적 다중 홉 확장을 통한 하이브리드 검색
  • 메모리 우선 도구와 테넌트 인식 해결 기능을 갖춘 MCP 서버
  • 각각 Python 및 JavaScript 패키지가 실시간으로 제공되는 REST API
  • 운영자가 테넌트, 메모리 및 시스템 상태를 검사할 수 있는 대시보드
  • 벡터 저장소, 임베더, 엔터티-팩트 백엔드 및 점수 매기기/라우팅을 위한 플러그 앤 플레이 확장 지점

벤치마크 접근 방식

창작자는 재현 가능한 접근 방식을 구현하여 메모리 스택 벤치마크의 일반적인 문제를 해결합니다:

  • 모든 실행은 사용된 정확한 구성 파일(프로필 + 렌더링됨)을 저장합니다
  • 하드웨어가 완전히 공개됩니다(CPU, GPU, RAM, 모델 버전)
  • 쌍 비교만 수행 — 모든 프로필에서 동일한 고정 장치/평가/top_k 사용
  • 속도 레인과 검색 품질 레인은 별도로 유지됩니다
Ad

성능 수치

Ryzen 9 7950X + RTX 5070에서 테스트한 벤치마크:

  • sqlite + 어휘적: 208 저장 작업/초, Top1=0.32, Recall@5=0.54
  • qdrant + ollama (all-minilm): 98 저장 작업/초, Top1=0.34, Recall@5=0.52
  • 파서+그래프(구조화된 메모리 스트레스 레인): 2.4 저장 작업/초 — 구조화된 추출 비용으로 인해 느리지만, LoCoMo에서는 평균 약 30, 일시적 최고치는 약 40 정도 기록

중요한 설명

Pali는 SaaS 의미에서의 LLM 메모리가 아닙니다. 이는 검은 상자 점수 매기기나 잠긴 제공자 결정 없이 자체 워크플로우에 최적화된 원시 검색 결과를 반환합니다. 앱 계약을 변경하지 않고 구성을 통해 벡터 백엔드, 임베더 및 점수 매기기 도구를 교체할 수 있습니다.

프로젝트 상태

버전 0.1이 최근에 적절한 벤치마크 제품군이 추가된 상태로 푸시되었습니다. 창작자는 기여자를 찾고 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

PocketTeam: 후크 기반 안전성과 학습 에이전트를 갖춘 Claude 코드 파이프라인
Tools

PocketTeam: 후크 기반 안전성과 학습 에이전트를 갖춘 Claude 코드 파이프라인

PocketTeam은 도구 호출 수준에서 .env 파일에 대한 쓰기나 rm -rf 명령어와 같은 위험한 작업을 차단하는 9개의 안전 계층을 구현한 Claude Code 파이프라인입니다. 이 시스템에는 완료된 작업을 분석하고 구조화된 학습 내용을 작성하여 향후 에이전트 성능을 향상시키는 Observer 에이전트가 포함되어 있습니다.

OpenClawRadar
클로드 코드 v2.1.126: 모델 선택기, 프로젝트 정리, OAuth 수정 및 보안 개선
Tools

클로드 코드 v2.1.126: 모델 선택기, 프로젝트 정리, OAuth 수정 및 보안 개선

Claude Code v2.1.126은 Anthropic 호환 게이트웨이용 /model 선택기, 새로운 claude project purge 명령어, WSL2/SSH/컨테이너에서의 OAuth 로그인 수정, 관리 설정 및 Windows에서 클립보드 노출 관련 보안 문제 패치를 추가했습니다.

OpenClawRadar
로컬 AI 에이전트 vs 클라우드 AI 에이전트 비교: OpenClaw와 Twin.so
Tools

로컬 AI 에이전트 vs 클라우드 AI 에이전트 비교: OpenClaw와 Twin.so

OpenClaw는 완전한 데이터 제어를 제공하는 로컬 머신에서 실행되는 오픈소스 로컬 AI 에이전트이며, Twin.so는 24/7 자동화를 위한 20만 개 이상의 커뮤니티 제작 에이전트를 보유한 클라우드 기반 플랫폼입니다.

OpenClawRadar
OpenClaw 모델 성능 검토: Codex 5.3 선두, GLM 모델 실망
Tools

OpenClaw 모델 성능 검토: Codex 5.3 선두, GLM 모델 실망

한 개발자가 여러 AI 모델을 OpenClaw로 테스트한 결과, Codex 5.3이 9/10점으로 가장 우수한 성능을 보였으며, GLM 4.7과 GLM 5는 높은 토큰 사용량, 느린 응답 속도, 일관성 없는 출력으로 인해 5/10점을 받았습니다.

OpenClawRadar