OmniRecall Beta: Memoria FAISS para LLM en Chat en la Nube

Qué hace OmniRecall

OmniRecall es una herramienta local de bypass para mitmproxy que intercepta el tráfico hacia interfaces de chat en la nube (probado en DeepSeek). Se infiltra en el flujo de fragmentos SSE propietario e impone una capa de memoria a largo plazo en un sistema diseñado para ser sin estado.

Mecanismo Técnico

Análisis Profundo de Paquetes: Reconstruye la respuesta completa del asistente rastreando parches en tiempo real
Control de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] en la salida de la IA
Cerebro Local: Mantiene memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
Inyección de Contexto: Los hechos más recordados se insertan forzosamente en tu siguiente mensaje como [RECALL: ...]

Estado Actual y Limitaciones

Esta es una versión beta/experimental. El desarrollador señala: "Es lo más cerca que he estado del sueño después de semanas de infierno depurando. Es buggy. Es experimental. [ADD] es mayormente estable, pero [SEARCH] es temperamental—si quieres perfección, arréglalo tú mismo. He llegado a mi límite de energía con esta versión."

Los cambios en la interfaz de usuario ascendente sí lo romperán. El desarrollador afirma: "Si se rompe, ahora es tu responsabilidad."

Requisitos y Configuración

Requisitos para PC Básico:

Solo CPU (faiss-cpu + all-MiniLM-L6-v2)
No se necesita LLM local — mejora los modelos en la nube que ya usas
Costo cero, sin claves API, aislamiento de datos 100% local

Cómo Desplegar:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Confía en el certificado CA de mitmproxy en tu SO/navegador (ejecuta mitmproxy una vez para generarlo). Configura el proxy del sistema a 127.0.0.1:8080. Luego ejecuta:

mitmdump -s omnirecall.py

Ve a chat.deepseek.com y comienza a alimentarlo con recuerdos.

Términos de la Licencia

El proyecto utiliza una licencia de código disponible con restricciones agresivas:

Sin uso comercial
Sin bifurcaciones privadas
ALTERATIONS.md obligatorio y público para cualquier cambio lógico
Si lo adaptas a Claude/GPT-4o/lo que sea, manténlo público según la licencia

El desarrollador explica: "He visto demasiados proyectos de desarrolladores solitarios ser despojados, privatizados o convertidos en SaaS de pago mientras el creador no recibe nada. Esta licencia no es amigable—está diseñada para proteger el trabajo precisamente de esa gente. Si los términos te asustan, ese es el punto."

📖 Leer la fuente completa: r/LocalLLaMA

OmniRecall Beta: Inyección de Memoria con Tecnología FAISS para Chats de LLM en la Nube

Qué hace OmniRecall

Mecanismo Técnico

Estado Actual y Limitaciones

Requisitos y Configuración

Términos de la Licencia

👀 Ver también

Claude Code obtiene verificación de modelos TLA+ mediante el servidor MCP tla-mcp

Exportador de Chat de IA: Una Extensión de Chrome para Conversaciones de Claude en PDF de Alta Fidelidad

AgentPVP: Una arena competitiva LLM centrada en agentes con ELO, rivalidades y caja de arena de inyección de prompts

Presentamos Swarmcore: un marco escalable de múltiples agentes en Python.