OmniRecall Beta: Injeção de Memória com FAISS para Chats de LLM na Nuvem

O que o OmniRecall Faz
OmniRecall é um bypass local do mitmproxy que intercepta o tráfego para interfaces de chat em nuvem (testado no DeepSeek). Ele invade o fluxo de fragmentos SSE proprietário e força uma camada de memória de longo prazo em um sistema que foi projetado para ser sem estado.
Mecanismo Técnico
- Análise Profunda de Pacotes: Reconstrói a resposta completa do assistente rastreando patches em tempo real
- Controle de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] da saída da IA
- Cérebro Local: Mantém memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
- Injeção de Contexto: Os fatos mais lembrados são forçados na sua próxima mensagem como [RECALL: ...]
Status Atual e Limitações
Esta é uma versão beta/experimental. O desenvolvedor observa: "Este é o mais próximo que cheguei do sonho depois de semanas de inferno de depuração. É bugado. É experimental. [ADD] é basicamente estável, mas [SEARCH] é temperamental—se você quer perfeição, conserte você mesmo. Cheguei ao meu limite de energia nesta versão."
Mudanças na interface do usuário upstream vão quebrá-lo. O desenvolvedor afirma: "Se quebrar, a responsabilidade é sua agora."
Requisitos e Configuração
Requisitos para PC Batata:
- Apenas CPU (faiss-cpu + all-MiniLM-L6-v2)
- Nenhum LLM local necessário — aumenta os modelos em nuvem que você já usa
- Custo zero, zero chaves de API, 100% de isolamento de dados local
Como Implantar:
pip install mitmproxy faiss-cpu sentence-transformers numpyConfie no certificado CA do mitmproxy no seu sistema operacional/navegador (execute o mitmproxy uma vez para gerá-lo). Configure o proxy do sistema para 127.0.0.1:8080. Então execute:
mitmdump -s omnirecall.pyVá para chat.deepseek.com e comece a alimentá-lo com memórias.
Termos da Licença
O projeto usa uma licença de código disponível agressivamente restritiva:
- Sem uso comercial
- Sem forks privados
- ALTERATIONS.md obrigatório e público para quaisquer alterações de lógica
- Se você portar para Claude/GPT-4o/qualquer outro, mantenha-o público conforme a licença
O desenvolvedor explica: "Vi muitos projetos de desenvolvedores solo serem explorados, privatizados ou transformados em SaaS pago enquanto o criador não recebe nada. Esta licença não é amigável—foi criada para proteger o trabalho exatamente dessas pessoas. Se os termos te assustam, esse é o ponto."
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Alternativa DIY para OpenClaw Usando Código Claude em Modo Headless
Um desenvolvedor criou um servidor Python que envia prompts para o Claude Code no modo headless, com acesso a bot do Telegram, automação Hammerspoon e armazenamento local de arquivos markdown para tarefas, agendas e notas.

Claude Octopus v8.48: Plugin de Orquestração Multi-IA para Fluxos de Trabalho de Desenvolvimento
Claude Octopus v8.48 é um plugin de código aberto que orquestra os modelos de IA Claude, Codex e Gemini em paralelo com funções distintas nas fases de desenvolvimento. Inclui um portão de consenso de 75% entre as fases, janelas de contexto novas para tarefas complexas e comandos específicos como /octo:embrace para desenvolvimento de ciclo de vida completo.

Análise da Arquitetura do Código do Claude a partir de Mapas de Origem Vazados
A análise do código-fonte TypeScript de 512.000 linhas do Claude Code revela um runtime baseado em Bun com CLI React/Ink, mais de 100 comandos, 38+ ferramentas e coordenação multiagente. O sistema utiliza Zod para validação, OpenTelemetry para telemetria e inclui mecanismos de compressão de contexto.

Red Queen: Um Orquestrador Determinístico que Executa Claude Code como um Pool de Trabalhadores
Red Queen usa uma máquina de estado para orquestrar subprocessos do Claude Code, eliminando erros de roteamento de LLMs e desperdício de tokens com mega-prompts.