Локальная система памяти MCP с консолидацией для AI-диалогов

✍️ OpenClawRadar📅 Опубликовано: 26 февраля 2026 г.🔗 Source

Что это такое

Разработчик создал локальную систему памяти для AI-диалогов, которая консолидирует и синтезирует информацию, а не просто хранит её. Построенная как MCP-сервер, она работает с совместимыми клиентами, такими как Claude Desktop и Claude Code, функционируя на 100% локально без передачи данных за пределы вашего оборудования.

Как это работает

Ключевое отличие от стандартных RAG-систем — процесс консолидации. Каждые 6 часов локальная LLM (Qwen 2.5-7B, работающая в LM Studio) группирует недавние воспоминания по темам и объединяет их в структурированные документы знаний. Она извлекает факты, решения и предпочтения, объединяя их с существующими знаниями и версионируя всё.

Технологический стек

Эмбеддинги: nomic-embed-text-v1.5 через LM Studio
Векторный поиск: FAISS (семантический + ключевые слова гибрид)
LLM для консолидации: Qwen 2.5-7B (Q4) через LM Studio
Хранилище: SQLite для эпизодов, FAISS для векторов
Протокол: MCP — работает со всем, что его поддерживает
Конфигурация: TOML

Возможности

Семантическое дедуплицирование с порогом косинусного сходства 0.95
Адаптивная оценка удивления — часто используемые воспоминания усиливаются, устаревшие ослабевают
Атомарная запись с tempfile + os.replace для защиты от сбоев
Удаление в FAISS на основе tombstone — O(1) вместо перестроения всего индекса
Плавная деградация — если LM Studio отключается, хранилище продолжает работать, консолидация приостанавливается
88 пройденных тестов

Инструменты MCP

memory_store — сохранить эпизод с типом, тегами, оценкой удивления
memory_recall — семантический поиск по эпизодам + консолидированным знаниям
memory_forget — пометить эпизод для удаления
memory_correct — обновить документ знаний
memory_export — полная JSON-резервная копия
memory_status — проверка состояния

Почему выбран MCP

Модели часто заменяются, но накопленные знания не должны исчезать вместе с ними. MCP делает память переносимой — одно хранилище, множество интерфейсов. Слой памяти становится ценнее любой отдельной модели.

Практические результаты

После примерно недели использования система создала документы знаний о компьютерном оборудовании, настройке VR, предпочтениях в программировании и архитектуре проектов — всё синтезировано из обычных диалогов. При начале новых чатов AI уже знает контекст пользователя без повторных объяснений.

Требования

Python 3.11+
LM Studio с загруженными Qwen 2.5-7B и nomic-embed-text-v1.5
Любой MCP-клиент

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

boxBot: Интеллектуальная колонка с открытым исходным кодом на базе Claude и Hailo AI

Разработчик под ником FunScore645 создал умную колонку boxBot, использующую Claude для агентного управления аппаратным обеспечением, Raspberry Pi, ускоритель ИИ Hailo и собственный SDK — проект с открытым исходным кодом на GitHub.

15 мая 2026 г., 04:17 UTC

OpenClawRadar

Инструменты

Плагин Swarm Orchestra v2 добавляет меж-агентный обмен сообщениями для устранения хаоса в команде кодовых агентов Claude.

Swarm Orchestra — это плагин, который решает проблемы с экспериментальной функцией TeamCreate в Claude Code, способной порождать неуправляемых агентов. Версия 2 добавляет обмен сообщениями между агентами через хук PreToolUse и самонастройку с помощью навыка /teammate.

19 мар. 2026 г., 13:45 UTC

OpenClawRadar

Инструменты

Три сервера MCP для исследования электронной коммерции с Claude: инструменты для Shopify, Amazon и Google Maps.

Разработчик создал три MCP-сервера для Claude, чтобы анализировать магазины Shopify без API-ключей, оценивать возможности продуктов на Amazon и находить/оценивать потенциальных клиентов среди местного бизнеса из Google Maps. Все они доступны на Apify.

4 апр. 2026 г., 22:45 UTC

OpenClawRadar

Инструменты

Встраиваемый OAuth-провайдер для персональных FastMCP серверов на всех платформах Claude

Разработчик создал OAuth-провайдер в одном файле на Python, который позволяет персональным серверам FastMCP работать на платформах Claude.ai (веб, мобильные и десктопные) без необходимости использования внешних сервисов аутентификации, таких как Auth0 или Google.

11 мар. 2026 г., 05:45 UTC

OpenClawRadar