RRF를 활용한 하이브리드 검색은 순수 벡터 검색보다 AI 메모리 시스템을 향상시킵니다

✍️ OpenClawRadar📅 게시일: April 15, 2026🔗 Source
RRF를 활용한 하이브리드 검색은 순수 벡터 검색보다 AI 메모리 시스템을 향상시킵니다
Ad

로컬 우선, 자체 호스팅 방식으로 PostgreSQL과 pgvector를 사용하는 AI 어시스턴트용 오픈소스 메모리 시스템이 개발되었습니다. 이 시스템은 AI 어시스턴트가 세션 간에 기억할 정보를 저장하고 검색 가능하게 만듭니다.

왜 순수 벡터 검색만으로는 부족했나

개발자는 처음에 순수 벡터 검색으로 시작했습니다: 쿼리를 임베딩하고, 코사인 유사도를 사용하며, 상위-k 결과를 반환하는 방식입니다. 이는 모호한 질문에는 효과적이었지만, 정확한 일치 검색에서는 지속적으로 실패했습니다. 예를 들어, "RRF merging"을 검색하면 "RRF merging"이라고 명시적으로 언급된 문서 대신 몇 달 전의 "순위 목록 결합"에 관한 청크가 반환되었습니다.

하이브리드 검색 솔루션

해결책은 두 번째 검색 방식을 추가하는 것이었습니다: PostgreSQL의 tsvector와 GIN 인덱스를 사용한 전문 검색입니다. 이 키워드 매칭은 벡터 검색이 놓치는 부분을 포착합니다. 그러나 이로 인해 병합이 필요한 두 개의 순위 목록이 생성되었습니다.

Reciprocal Rank Fusion (RRF)

두 순위 목록을 병합하는 데는 Reciprocal Rank Fusion이 해답으로 증명되었습니다. 공식은 간단합니다: 점수 = 1 / (k + 순위), 여기서 k=60(표준값)입니다. 두 목록 모두에 나타나는 결과는 두 점수를 합산합니다. 이 접근 방식은 코사인 유사도와 ts_rank 간의 가중치 조정이나 점수 정규화가 필요하지 않으며, 오직 순위 위치만 사용합니다.

Ad

쿼리 강화 기술

검색 전에 시스템은 임베딩 모델의 WordPiece 토크나이저를 통해 쿼리를 실행하여 핵심 용어(기술적이거나 도메인 용어일 가능성이 높은 다중 서브워드 토큰)를 추출합니다. 이는 최대 3개의 쿼리 변형을 생성하고, 모두 임베딩하여 병렬로 검색합니다. 이렇게 하면 한 가지 표현 방식이 놓칠 수 있는 결과를 포착할 수 있습니다.

기술 스택

  • PostgreSQL 16 + pgvector (벡터용 HNSW 인덱스, 전문 검색용 GIN 인덱스)
  • 임베딩용 all-MiniLM-L6-v2 (384차원, CPU에서 실행)
  • 비동기 psycopg 3를 사용한 Python
  • 3가지 수집 어댑터: 마크다운, 평문, Claude 대화 JSON

전체 시스템은 임베딩을 위한 API 호출 없이 로컬에서 실행되며 클라우드 의존성이 없습니다. 코드는 최근에 배포되었으며, 개발자는 전체 접근 방식에 대해 상세한 블로그 포스트를 작성했습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Devvit용 Claude 스킬이 코드 생성 정확도를 73%에서 100%로 향상시킵니다
Tools

Devvit용 Claude 스킬이 코드 생성 정확도를 73%에서 100%로 향상시킵니다

한 개발자가 Claude를 위한 구조화된 SKILL.md 프롬프트 레이어를 만들어 Reddit의 Devvit 플랫폼에 대한 컨텍스트를 제공했으며, 이를 통해 일반적인 Devvit 작업에서 평가 결과를 7/10점에서 10/10점으로 향상시켜 특정 런타임 버그를 방지했습니다.

OpenClawRadar
아담: C 언어로 제작된 임베디드 크로스 플랫폼 AI 에이전트 라이브러리
Tools

아담: C 언어로 제작된 임베디드 크로스 플랫폼 AI 에이전트 라이브러리

Adam은 툴 호출, 메모리, 음성, 클라우드/로컬 LLM 지원 모두를 갖춘 완전한 에이전트 루프를 제공하는 C 라이브러리로, 모든 애플리케이션에 내장될 수 있도록 설계되었습니다.

OpenClawRadar
OpenClaw 기술은 자체 실행을 가능하게 하여 에이전트 전환을 줄입니다.
Tools

OpenClaw 기술은 자체 실행을 가능하게 하여 에이전트 전환을 줄입니다.

OpenClaw 에이전트를 위한 새로운 스킬이 개발되어, 에이전트가 다음 단계를 파악한 후 '다음에 할 일은 다음과 같습니다'라는 메시지를 출력하고 작업을 인간 운영자에게 넘겨주는 일반적인 문제를 해결합니다. 이 스킬을 통해 에이전트는 등록, 게시, 답장, 서명 등 특정 작업을 스스로 수행할 수 있게 됩니다.

OpenClawRadar
클로드 코드용 디자인 스튜디오 플러그인, 9가지 역할과 16개 명령어로 구성된 가상 디자인 팀 추가
Tools

클로드 코드용 디자인 스튜디오 플러그인, 9가지 역할과 16개 명령어로 구성된 가상 디자인 팀 추가

Design Studio라는 새로운 Claude Code 플러그인은 9개의 전문가 역할, 16개의 슬래시 명령어, 5개의 에이전트로 구성된 완전한 디자인 팀을 시뮬레이션합니다. 기술 스택을 자동으로 감지하며 참조 파일에 걸쳐 8,000줄 이상의 디자인 지식을 포함합니다.

OpenClawRadar