OmniRecall 베타: 클라우드 LLM 채팅을 위한 FAISS 기반 메모리 주입

OmniRecall의 기능
OmniRecall은 클라우드 채팅 인터페이스(DeepSeek에서 테스트됨)로 향하는 트래픽을 가로채는 로컬 mitmproxy 우회 도구입니다. 이는 독점적인 SSE 조각 스트림에 침투하여, 상태를 유지하지 않도록 설계된 시스템에 장기 기억 계층을 강제로 부여합니다.
기술적 메커니즘
- 심층 패킷 파싱: 실시간 패치를 추적하여 전체 어시스턴트 응답을 재구성합니다.
- 명령 제어: AI 출력에서 [ADD], [UPDATE], [REMOVE], [CLEAR]를 감지합니다.
- 로컬 브레인: memory.txt + FAISS 인덱스(sentence-transformers MiniLM-L6)를 유지합니다.
- 컨텍스트 주입: 상위 회상된 사실들이 다음 메시지에 [RECALL: ...]로 강제 주입됩니다.
현재 상태 및 제한 사항
이것은 베타/실험적 릴리스입니다. 개발자는 다음과 같이 언급합니다: "몇 주간의 디버깅 지옥 끝에 꿈에 가장 가까워졌습니다. 버그가 많습니다. 실험적입니다. [ADD]는 대체로 안정적이지만, [SEARCH]는 변덕스럽습니다—완벽함을 원한다면 직접 고치세요. 이 빌드에 대한 에너지 한계에 도달했습니다."
업스트림 UI 변경은 반드시 이를 깨뜨릴 것입니다. 개발자는 다음과 같이 명시합니다: "만약 깨진다면, 이제 그것은 당신의 책임입니다."
요구 사항 및 설정
저사양 PC 요구 사항:
- CPU 전용 (faiss-cpu + all-MiniLM-L6-v2)
- 로컬 LLM 불필요 — 이미 사용 중인 클라우드 모델을 보강합니다
- 비용 없음, API 키 없음, 100% 로컬 데이터 격리
배포 방법:
pip install mitmproxy faiss-cpu sentence-transformers numpyOS/브라우저에서 mitmproxy CA 인증서를 신뢰하세요(한 번 실행하여 생성). 시스템 프록시를 127.0.0.1:8080으로 설정하세요. 그런 다음 실행하세요:
mitmdump -s omnirecall.pychat.deepseek.com으로 이동하여 기억을 공급하기 시작하세요.
라이선스 조건
이 프로젝트는 공격적으로 제한적인 소스 이용 가능 라이선스를 사용합니다:
- 상업적 사용 불가
- 비공개 포크 불가
- 논리 변경 시 필수 공개 ALTERATIONS.md
- Claude/GPT-4o/기타로 포팅 시 라이선스에 따라 공개 유지
개발자는 설명합니다: "너무 많은 솔로 개발자 프로젝트가 채굴되거나, 사유화되거나, 유료 SaaS로 전환되는 동안 창작자는 아무것도 얻지 못하는 것을 지켜봤습니다. 이 라이선스는 친근하지 않습니다—바로 그런 사람들로부터 작업을 보호하기 위해 만들어졌습니다. 조건이 당신을 겁나게 한다면, 그것이 목적입니다."
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

클로드 스킬 관리자, 181개 에이전트 스킬 라이브러리에 대한 피드백 요청
claude-skills의 관리자인 Reza는 181개의 에이전트 스킬, 250개의 Python 도구, 11개의 AI 코딩 도구에서 작동하는 15개의 에이전트 페르소나를 포함한 오픈소스 라이브러리에 대한 커뮤니티 피드백을 요청하고 있습니다. 그는 분리된 스킬 접근 방식이 효과적인지 의문을 제기하며, 부족한 스킬, 페르소나 기반 에이전트, 도구 통합에 대한 의견을 원합니다.

civStation: Civilization VI 자연어 제어를 위한 오픈소스 VLM 하네스
civStation은 VLM 기반 관찰 및 실행 루프를 통해 고급 전략 명령을 UI 동작으로 변환하여 Civilization VI를 음성 및 자연어로 제어할 수 있는 오픈소스 컴퓨터 사용 스택입니다.

보데가 추론 엔진: Apple Silicon의 통합 메모리를 위한 LLM 추론 최적화
Bodega는 Apple Silicon의 통합 메모리 아키텍처를 위해 특별히 구축된 추론 엔진으로, MLX에서 연속 배칭과 KV 캐시 관리를 재설계하여 처리량 한계를 해결합니다. 개발자는 Metal 레이어에 가까운 최적화와 함께 2.5년 동안 작업했다고 보고합니다.

AI 코딩 도구 분석: 3,177개의 API 호출 해부하기
3,177개의 API 호출에 대한 기술적 분석은 4가지 AI 코딩 도구가 컨텍스트 창을 관리하는 방식을 밝혀내며 비효율성과 차이점을 드러냅니다.