OmniRecall Beta: Injeção de Memória com FAISS em Chats LLM

O que o OmniRecall Faz

OmniRecall é um bypass local do mitmproxy que intercepta o tráfego para interfaces de chat em nuvem (testado no DeepSeek). Ele invade o fluxo de fragmentos SSE proprietário e força uma camada de memória de longo prazo em um sistema que foi projetado para ser sem estado.

Mecanismo Técnico

Análise Profunda de Pacotes: Reconstrói a resposta completa do assistente rastreando patches em tempo real
Controle de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] da saída da IA
Cérebro Local: Mantém memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
Injeção de Contexto: Os fatos mais lembrados são forçados na sua próxima mensagem como [RECALL: ...]

Status Atual e Limitações

Esta é uma versão beta/experimental. O desenvolvedor observa: "Este é o mais próximo que cheguei do sonho depois de semanas de inferno de depuração. É bugado. É experimental. [ADD] é basicamente estável, mas [SEARCH] é temperamental—se você quer perfeição, conserte você mesmo. Cheguei ao meu limite de energia nesta versão."

Mudanças na interface do usuário upstream vão quebrá-lo. O desenvolvedor afirma: "Se quebrar, a responsabilidade é sua agora."

Requisitos e Configuração

Requisitos para PC Batata:

Apenas CPU (faiss-cpu + all-MiniLM-L6-v2)
Nenhum LLM local necessário — aumenta os modelos em nuvem que você já usa
Custo zero, zero chaves de API, 100% de isolamento de dados local

Como Implantar:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Confie no certificado CA do mitmproxy no seu sistema operacional/navegador (execute o mitmproxy uma vez para gerá-lo). Configure o proxy do sistema para 127.0.0.1:8080. Então execute:

mitmdump -s omnirecall.py

Vá para chat.deepseek.com e comece a alimentá-lo com memórias.

Termos da Licença

O projeto usa uma licença de código disponível agressivamente restritiva:

Sem uso comercial
Sem forks privados
ALTERATIONS.md obrigatório e público para quaisquer alterações de lógica
Se você portar para Claude/GPT-4o/qualquer outro, mantenha-o público conforme a licença

O desenvolvedor explica: "Vi muitos projetos de desenvolvedores solo serem explorados, privatizados ou transformados em SaaS pago enquanto o criador não recebe nada. Esta licença não é amigável—foi criada para proteger o trabalho exatamente dessas pessoas. Se os termos te assustam, esse é o ponto."

📖 Leia a fonte completa: r/LocalLLaMA