OmniRecall Beta: Inyección de Memoria con Tecnología FAISS para Chats de LLM en la Nube

✍️ OpenClawRadar📅 Publicado: 16 de marzo de 2026🔗 Source
OmniRecall Beta: Inyección de Memoria con Tecnología FAISS para Chats de LLM en la Nube
Ad

Qué hace OmniRecall

OmniRecall es una herramienta local de bypass para mitmproxy que intercepta el tráfico hacia interfaces de chat en la nube (probado en DeepSeek). Se infiltra en el flujo de fragmentos SSE propietario e impone una capa de memoria a largo plazo en un sistema diseñado para ser sin estado.

Mecanismo Técnico

  • Análisis Profundo de Paquetes: Reconstruye la respuesta completa del asistente rastreando parches en tiempo real
  • Control de Comandos: Detecta [ADD], [UPDATE], [REMOVE], [CLEAR] en la salida de la IA
  • Cerebro Local: Mantiene memory.txt + índice FAISS (sentence-transformers MiniLM-L6)
  • Inyección de Contexto: Los hechos más recordados se insertan forzosamente en tu siguiente mensaje como [RECALL: ...]

Estado Actual y Limitaciones

Esta es una versión beta/experimental. El desarrollador señala: "Es lo más cerca que he estado del sueño después de semanas de infierno depurando. Es buggy. Es experimental. [ADD] es mayormente estable, pero [SEARCH] es temperamental—si quieres perfección, arréglalo tú mismo. He llegado a mi límite de energía con esta versión."

Los cambios en la interfaz de usuario ascendente lo romperán. El desarrollador afirma: "Si se rompe, ahora es tu responsabilidad."

Ad

Requisitos y Configuración

Requisitos para PC Básico:

  • Solo CPU (faiss-cpu + all-MiniLM-L6-v2)
  • No se necesita LLM local — mejora los modelos en la nube que ya usas
  • Costo cero, sin claves API, aislamiento de datos 100% local

Cómo Desplegar:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Confía en el certificado CA de mitmproxy en tu SO/navegador (ejecuta mitmproxy una vez para generarlo). Configura el proxy del sistema a 127.0.0.1:8080. Luego ejecuta:

mitmdump -s omnirecall.py

Ve a chat.deepseek.com y comienza a alimentarlo con recuerdos.

Términos de la Licencia

El proyecto utiliza una licencia de código disponible con restricciones agresivas:

  • Sin uso comercial
  • Sin bifurcaciones privadas
  • ALTERATIONS.md obligatorio y público para cualquier cambio lógico
  • Si lo adaptas a Claude/GPT-4o/lo que sea, manténlo público según la licencia

El desarrollador explica: "He visto demasiados proyectos de desarrolladores solitarios ser despojados, privatizados o convertidos en SaaS de pago mientras el creador no recibe nada. Esta licencia no es amigable—está diseñada para proteger el trabajo precisamente de esa gente. Si los términos te asustan, ese es el punto."

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Claude Code obtiene verificación de modelos TLA+ mediante el servidor MCP tla-mcp
Herramientas

Claude Code obtiene verificación de modelos TLA+ mediante el servidor MCP tla-mcp

tla-mcp es un nuevo servidor MCP que permite a Claude Code invocar al verificador de modelos TLA+ tla-rs como una herramienta de primera clase: valida especificaciones, ejecuta comprobaciones acotadas con trazas de contraejemplos y reproduce escenarios desde el chat.

OpenClawRadar
Exportador de Chat de IA: Una Extensión de Chrome para Conversaciones de Claude en PDF de Alta Fidelidad
Herramientas

Exportador de Chat de IA: Una Extensión de Chrome para Conversaciones de Claude en PDF de Alta Fidelidad

Un desarrollador creó AI Chat Exporter, una extensión de Chrome que preserva matemáticas, código e imágenes al exportar conversaciones de Claude a PDF. La herramienta utiliza un motor de renderizado local basado en navegador desarrollado con Claude 3.5 Sonnet para manejar el formato progresivo de markdown y LaTeX.

OpenClawRadar
AgentPVP: Una arena competitiva LLM centrada en agentes con ELO, rivalidades y caja de arena de inyección de prompts
Herramientas

AgentPVP: Una arena competitiva LLM centrada en agentes con ELO, rivalidades y caja de arena de inyección de prompts

AgentPVP permite que agentes LLM se registren, jueguen 5 juegos de mesa a través de APIs JSON, mantengan un ELO por juego, escriban archivos de rivalidad y se insulten mutuamente en un salón global. El HTML es opcional: la API es el sitio.

OpenClawRadar
Presentamos Swarmcore: un marco escalable de múltiples agentes en Python.
Herramientas

Presentamos Swarmcore: un marco escalable de múltiples agentes en Python.

Swarmcore es una biblioteca de código abierto para ejecutar flujos de trabajo escalables de múltiples agentes en Python, que presenta ejecución secuencial o paralela y un sistema de gestión de contexto ampliable.

OpenClawRadar