OmniRecall 베타: FAISS 기반 메모리 주입으로 LLM 채팅 개선

OmniRecall의 기능

OmniRecall은 클라우드 채팅 인터페이스(DeepSeek에서 테스트됨)로 향하는 트래픽을 가로채는 로컬 mitmproxy 우회 도구입니다. 이는 독점적인 SSE 조각 스트림에 침투하여, 상태를 유지하지 않도록 설계된 시스템에 장기 기억 계층을 강제로 부여합니다.

기술적 메커니즘

심층 패킷 파싱: 실시간 패치를 추적하여 전체 어시스턴트 응답을 재구성합니다.
명령 제어: AI 출력에서 [ADD], [UPDATE], [REMOVE], [CLEAR]를 감지합니다.
로컬 브레인: memory.txt + FAISS 인덱스(sentence-transformers MiniLM-L6)를 유지합니다.
컨텍스트 주입: 상위 회상된 사실들이 다음 메시지에 [RECALL: ...]로 강제 주입됩니다.

현재 상태 및 제한 사항

이것은 베타/실험적 릴리스입니다. 개발자는 다음과 같이 언급합니다: "몇 주간의 디버깅 지옥 끝에 꿈에 가장 가까워졌습니다. 버그가 많습니다. 실험적입니다. [ADD]는 대체로 안정적이지만, [SEARCH]는 변덕스럽습니다—완벽함을 원한다면 직접 고치세요. 이 빌드에 대한 에너지 한계에 도달했습니다."

업스트림 UI 변경은 반드시 이를 깨뜨릴 것입니다. 개발자는 다음과 같이 명시합니다: "만약 깨진다면, 이제 그것은 당신의 책임입니다."

요구 사항 및 설정

저사양 PC 요구 사항:

CPU 전용 (faiss-cpu + all-MiniLM-L6-v2)
로컬 LLM 불필요 — 이미 사용 중인 클라우드 모델을 보강합니다
비용 없음, API 키 없음, 100% 로컬 데이터 격리

배포 방법:

pip install mitmproxy faiss-cpu sentence-transformers numpy

OS/브라우저에서 mitmproxy CA 인증서를 신뢰하세요(한 번 실행하여 생성). 시스템 프록시를 127.0.0.1:8080으로 설정하세요. 그런 다음 실행하세요:

mitmdump -s omnirecall.py

chat.deepseek.com으로 이동하여 기억을 공급하기 시작하세요.

라이선스 조건

이 프로젝트는 공격적으로 제한적인 소스 이용 가능 라이선스를 사용합니다:

상업적 사용 불가
비공개 포크 불가
논리 변경 시 필수 공개 ALTERATIONS.md
Claude/GPT-4o/기타로 포팅 시 라이선스에 따라 공개 유지

개발자는 설명합니다: "너무 많은 솔로 개발자 프로젝트가 채굴되거나, 사유화되거나, 유료 SaaS로 전환되는 동안 창작자는 아무것도 얻지 못하는 것을 지켜봤습니다. 이 라이선스는 친근하지 않습니다—바로 그런 사람들로부터 작업을 보호하기 위해 만들어졌습니다. 조건이 당신을 겁나게 한다면, 그것이 목적입니다."

📖 전체 소스 읽기: r/LocalLLaMA