LTP и избирательное забывание: биовдохновленная память для LLM

Био-вдохновленная архитектура памяти для локальных LLM

Разработчик создал локальный MCP-сервер, который имитирует механизмы человеческой памяти для поддержания чистого контекста локальных LLM. Система реализует три био-вдохновленных слоя на Python/TypeScript вместо статичного RAG-пайплайна.

Основные механизмы памяти

Подкрепление (Долговременная потенциация): Каждый раз, когда запрашивается тема, её access_count увеличивается, укрепляя часто используемые воспоминания.
Селективное забывание: Неиспользуемые связи со временем затухают, система автоматически архивирует слабые атомы, чтобы предотвратить загрязнение контекста.
Консолидация: Еженедельный цикл "сна" дистиллирует недавние логи в основные атомы знаний с использованием облегчённой SLM.

Технические детали реализации

Гибридный поиск: Сочетает sqlite-vec для семантического поиска с текстовыми запасными вариантами, чтобы предотвратить таймауты даже при сбое эмбеддингов.
Неблокирующий MCP: Оборачивает синхронные операции базы данных и эмбеддингов в исполнители asyncio, чтобы LM Studio оставался отзывчивым.
Слой идентичности: Использует постоянный файл "Soul" (soul.md) для сохранения состояния и персоны между сессиями.
Подкрепление на основе доступа: Механизм access_count позволяет модели эволюционировать на основе паттернов взаимодействия, а не просто извлекать статические факты.

Контекст разработки и валидация

Проект был разработан для решения проблемы ограничений контекста в стандартных RAG-реализациях для локального ИИ. Разработчик проверил архитектуру, попросив локальную LLM (запущенную на Gemini) проанализировать код, что выделило три инновации: истинные когнитивные агенты, использующие подкрепление на основе доступа и затухание, надёжный гибридный поиск с запасными вариантами и неблокирующую архитектуру для отзывчивости.

Цель — создать систему, которая помнит важное и забывает шум, подобно человеческой памяти во время сна. Разработчик исследует, могут ли био-вдохновленные архитектуры памяти решить локальные ограничения контекста без зависимостей от облака или чёрных ящиков.

📖 Read the full source: r/LocalLLaMA

Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания

Био-вдохновленная архитектура памяти для локальных LLM

Основные механизмы памяти

Технические детали реализации

Контекст разработки и валидация

👀 Смотрите также

Два инструмента MCP для Claude Code: Проверка идей и Память торгового агента

Библиотека рабочих процессов Claude теперь автоматически отслеживает и оценивает рабочие процессы из Reddit

Как переместить или переименовать папки проекта Claude Code без потери истории сессий

RCFlow: оркестратор с открытым исходным кодом для Claude Code, Codex и OpenCode с управлением несколькими сессиями