OmniRecall Beta: Inyección de Memoria con Tecnología FAISS para Chats de LLM en la Nube

Qué hace OmniRecall
OmniRecall es una herramienta local de bypass para mitmproxy que intercepta el tráfico hacia interfaces de chat en la nube (probado en DeepSeek). Se infiltra en el flujo de fragmentos SSE propietario e impone una capa de memoria a largo plazo en un sistema diseñado para ser sin estado.
Mecanismo Técnico
- Análisis Profundo de Paquetes: Reconstruye la respuesta completa del asistente rastreando parches en tiempo real
- Control de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] en la salida de la IA
- Cerebro Local: Mantiene memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
- Inyección de Contexto: Los hechos más recordados se insertan forzosamente en tu siguiente mensaje como [RECALL: ...]
Estado Actual y Limitaciones
Esta es una versión beta/experimental. El desarrollador señala: "Es lo más cerca que he estado del sueño después de semanas de infierno depurando. Es buggy. Es experimental. [ADD] es mayormente estable, pero [SEARCH] es temperamental—si quieres perfección, arréglalo tú mismo. He llegado a mi límite de energía con esta versión."
Los cambios en la interfaz de usuario ascendente sí lo romperán. El desarrollador afirma: "Si se rompe, ahora es tu responsabilidad."
Requisitos y Configuración
Requisitos para PC Básico:
- Solo CPU (faiss-cpu + all-MiniLM-L6-v2)
- No se necesita LLM local — mejora los modelos en la nube que ya usas
- Costo cero, sin claves API, aislamiento de datos 100% local
Cómo Desplegar:
pip install mitmproxy faiss-cpu sentence-transformers numpyConfía en el certificado CA de mitmproxy en tu SO/navegador (ejecuta mitmproxy una vez para generarlo). Configura el proxy del sistema a 127.0.0.1:8080. Luego ejecuta:
mitmdump -s omnirecall.pyVe a chat.deepseek.com y comienza a alimentarlo con recuerdos.
Términos de la Licencia
El proyecto utiliza una licencia de código disponible con restricciones agresivas:
- Sin uso comercial
- Sin bifurcaciones privadas
- ALTERATIONS.md obligatorio y público para cualquier cambio lógico
- Si lo adaptas a Claude/GPT-4o/lo que sea, manténlo público según la licencia
El desarrollador explica: "He visto demasiados proyectos de desarrolladores solitarios ser despojados, privatizados o convertidos en SaaS de pago mientras el creador no recibe nada. Esta licencia no es amigable—está diseñada para proteger el trabajo precisamente de esa gente. Si los términos te asustan, ese es el punto."
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Claude Code obtiene verificación de modelos TLA+ mediante el servidor MCP tla-mcp
tla-mcp es un nuevo servidor MCP que permite a Claude Code invocar al verificador de modelos TLA+ tla-rs como una herramienta de primera clase: valida especificaciones, ejecuta comprobaciones acotadas con trazas de contraejemplos y reproduce escenarios desde el chat.

Exportador de Chat de IA: Una Extensión de Chrome para Conversaciones de Claude en PDF de Alta Fidelidad
Un desarrollador creó AI Chat Exporter, una extensión de Chrome que preserva matemáticas, código e imágenes al exportar conversaciones de Claude a PDF. La herramienta utiliza un motor de renderizado local basado en navegador desarrollado con Claude 3.5 Sonnet para manejar el formato progresivo de markdown y LaTeX.

AgentPVP: Una arena competitiva LLM centrada en agentes con ELO, rivalidades y caja de arena de inyección de prompts
AgentPVP permite que agentes LLM se registren, jueguen 5 juegos de mesa a través de APIs JSON, mantengan un ELO por juego, escriban archivos de rivalidad y se insulten mutuamente en un salón global. El HTML es opcional: la API es el sitio.

Presentamos Swarmcore: un marco escalable de múltiples agentes en Python.
Swarmcore es una biblioteca de código abierto para ejecutar flujos de trabajo escalables de múltiples agentes en Python, que presenta ejecución secuencial o paralela y un sistema de gestión de contexto ampliable.