OmniRecall Beta: Injeção de Memória com FAISS para Chats de LLM na Nuvem

✍️ OpenClawRadar📅 Publicado: March 16, 2026🔗 Source
OmniRecall Beta: Injeção de Memória com FAISS para Chats de LLM na Nuvem
Ad

O que o OmniRecall Faz

OmniRecall é um bypass local do mitmproxy que intercepta o tráfego para interfaces de chat em nuvem (testado no DeepSeek). Ele invade o fluxo de fragmentos SSE proprietário e força uma camada de memória de longo prazo em um sistema que foi projetado para ser sem estado.

Mecanismo Técnico

  • Análise Profunda de Pacotes: Reconstrói a resposta completa do assistente rastreando patches em tempo real
  • Controle de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] da saída da IA
  • Cérebro Local: Mantém memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
  • Injeção de Contexto: Os fatos mais lembrados são forçados na sua próxima mensagem como [RECALL: ...]

Status Atual e Limitações

Esta é uma versão beta/experimental. O desenvolvedor observa: "Este é o mais próximo que cheguei do sonho depois de semanas de inferno de depuração. É bugado. É experimental. [ADD] é basicamente estável, mas [SEARCH] é temperamental—se você quer perfeição, conserte você mesmo. Cheguei ao meu limite de energia nesta versão."

Mudanças na interface do usuário upstream vão quebrá-lo. O desenvolvedor afirma: "Se quebrar, a responsabilidade é sua agora."

Ad

Requisitos e Configuração

Requisitos para PC Batata:

  • Apenas CPU (faiss-cpu + all-MiniLM-L6-v2)
  • Nenhum LLM local necessário — aumenta os modelos em nuvem que você já usa
  • Custo zero, zero chaves de API, 100% de isolamento de dados local

Como Implantar:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Confie no certificado CA do mitmproxy no seu sistema operacional/navegador (execute o mitmproxy uma vez para gerá-lo). Configure o proxy do sistema para 127.0.0.1:8080. Então execute:

mitmdump -s omnirecall.py

Vá para chat.deepseek.com e comece a alimentá-lo com memórias.

Termos da Licença

O projeto usa uma licença de código disponível agressivamente restritiva:

  • Sem uso comercial
  • Sem forks privados
  • ALTERATIONS.md obrigatório e público para quaisquer alterações de lógica
  • Se você portar para Claude/GPT-4o/qualquer outro, mantenha-o público conforme a licença

O desenvolvedor explica: "Vi muitos projetos de desenvolvedores solo serem explorados, privatizados ou transformados em SaaS pago enquanto o criador não recebe nada. Esta licença não é amigável—foi criada para proteger o trabalho exatamente dessas pessoas. Se os termos te assustam, esse é o ponto."

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Alternativa DIY para OpenClaw Usando Código Claude em Modo Headless
Tools

Alternativa DIY para OpenClaw Usando Código Claude em Modo Headless

Um desenvolvedor criou um servidor Python que envia prompts para o Claude Code no modo headless, com acesso a bot do Telegram, automação Hammerspoon e armazenamento local de arquivos markdown para tarefas, agendas e notas.

OpenClawRadar
Claude Octopus v8.48: Plugin de Orquestração Multi-IA para Fluxos de Trabalho de Desenvolvimento
Tools

Claude Octopus v8.48: Plugin de Orquestração Multi-IA para Fluxos de Trabalho de Desenvolvimento

Claude Octopus v8.48 é um plugin de código aberto que orquestra os modelos de IA Claude, Codex e Gemini em paralelo com funções distintas nas fases de desenvolvimento. Inclui um portão de consenso de 75% entre as fases, janelas de contexto novas para tarefas complexas e comandos específicos como /octo:embrace para desenvolvimento de ciclo de vida completo.

OpenClawRadar
Análise da Arquitetura do Código do Claude a partir de Mapas de Origem Vazados
Tools

Análise da Arquitetura do Código do Claude a partir de Mapas de Origem Vazados

A análise do código-fonte TypeScript de 512.000 linhas do Claude Code revela um runtime baseado em Bun com CLI React/Ink, mais de 100 comandos, 38+ ferramentas e coordenação multiagente. O sistema utiliza Zod para validação, OpenTelemetry para telemetria e inclui mecanismos de compressão de contexto.

OpenClawRadar
Red Queen: Um Orquestrador Determinístico que Executa Claude Code como um Pool de Trabalhadores
Tools

Red Queen: Um Orquestrador Determinístico que Executa Claude Code como um Pool de Trabalhadores

Red Queen usa uma máquina de estado para orquestrar subprocessos do Claude Code, eliminando erros de roteamento de LLMs e desperdício de tokens com mega-prompts.

OpenClawRadar