OmniRecall Beta: Внедрение памяти на основе FAISS для облачных чатов с LLM.

Что делает OmniRecall
OmniRecall — это локальный обход mitmproxy, который перехватывает трафик к облачным чат-интерфейсам (протестировано на DeepSeek). Он взламывает проприетарный поток фрагментов SSE и насильно добавляет слой долговременной памяти в систему, которая была разработана как stateless.
Технический механизм
- Глубокий парсинг пакетов: Восстанавливает полный ответ ассистента, отслеживая патчи в реальном времени
- Управление командами: Обнаруживает [ADD], [UPDATE], [REMOVE], [CLEAR] в выводе ИИ
- Локальный мозг: Поддерживает memory.txt + индекс FAISS (sentence-transformers MiniLM-L6)
- Инъекция контекста: Наиболее релевантные факты принудительно добавляются в ваше следующее сообщение как [RECALL: ...]
Текущий статус и ограничения
Это бета/экспериментальный релиз. Разработчик отмечает: "Это максимально близко к мечте после недель адской отладки. Он бажный. Он экспериментальный. [ADD] в основном стабилен, но [SEARCH] капризный — если хотите совершенства, исправьте сами. Я достиг предела энергии на этой сборке."
Изменения в вышестоящем интерфейсе обязательно сломают его. Разработчик заявляет: "Если сломается, теперь это ваша проблема."
Требования и настройка
Требования для слабого ПК:
- Только CPU (faiss-cpu + all-MiniLM-L6-v2)
- Локальная LLM не требуется — дополняет облачные модели, которые вы уже используете
- Нулевая стоимость, нулевые API-ключи, 100% локальная изоляция данных
Как развернуть:
pip install mitmproxy faiss-cpu sentence-transformers numpyДоверьтесь сертификату CA mitmproxy в вашей ОС/браузере (запустите mitmproxy один раз для его генерации). Установите системный прокси на 127.0.0.1:8080. Затем запустите:
mitmdump -s omnirecall.pyПерейдите на chat.deepseek.com и начните наполнять его воспоминаниями.
Условия лицензии
Проект использует агрессивно ограничивающую лицензию с доступом к исходному коду:
- Запрещено коммерческое использование
- Запрещены приватные форки
- Обязательный публичный ALTERATIONS.md для любых изменений логики
- Если портируете на Claude/GPT-4o/что-либо ещё, сохраняйте публичность согласно лицензии
Разработчик поясняет: "Я видел, как слишком много проектов одиночек разбирают на части, приватизируют или превращают в платный SaaS, а создатель не получает ничего. Эта лицензия не дружелюбна — она создана, чтобы защитить работу именно от таких людей. Если условия вас пугают, в этом и есть смысл."
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

IM для агентов: REST-ориентированный чат для коммуникации AI-агентов без использования SDK.
Разработчик создал IM for Agents — инструмент, который создаёт общие чат-комнаты, где ИИ-агенты общаются напрямую через REST API без SDK или конфигурационных файлов. Агенты используют простой промпт для присоединения к комнатам и могут договариваться об API, писать код и проверять работу, пока люди наблюдают.

Claude Code: Как подключить созданный с помощью ИИ фронтенд к реальному бэкенду
Claude Code создаёт красивые интерфейсы, но часто использует жёстко заданные данные. Вот четыре способа подключить его к реальным бэкендам: сырые API, SDK, CLI и MCP.

Ежемесячный план Alibaba стоимостью $10 предоставляет пользователям OpenClaw расширенный доступ к множеству ИИ-моделей.
За 10 долларов в месяц план от Alibaba предоставляет доступ к моделям Qwen3.5-Plus, Kimi-K2.5, GLM-5 и MiniMax-M2.5 с квотами в 1200 запросов за 5 часов, 9000 в неделю и 18 000 в месяц.

Подключение OpenClaw к Qwen2.5: осуществимость и соображения
Исследуйте возможность подключения OpenClaw к локальной модели Qwen2.5 Coder с 7 миллиардами параметров, чтобы решить проблемы с лимитом запросов при использовании API Gemini 3.