Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания

Био-вдохновленная архитектура памяти для локальных LLM
Разработчик создал локальный MCP-сервер, который имитирует механизмы человеческой памяти для поддержания чистого контекста локальных LLM. Система реализует три био-вдохновленных слоя на Python/TypeScript вместо статичного RAG-пайплайна.
Основные механизмы памяти
- Подкрепление (Долговременная потенциация): Каждый раз, когда запрашивается тема, её
access_countувеличивается, укрепляя часто используемые воспоминания. - Селективное забывание: Неиспользуемые связи со временем затухают, система автоматически архивирует слабые атомы, чтобы предотвратить загрязнение контекста.
- Консолидация: Еженедельный цикл "сна" дистиллирует недавние логи в основные атомы знаний с использованием облегчённой SLM.
Технические детали реализации
- Гибридный поиск: Сочетает
sqlite-vecдля семантического поиска с текстовыми запасными вариантами, чтобы предотвратить таймауты даже при сбое эмбеддингов. - Неблокирующий MCP: Оборачивает синхронные операции базы данных и эмбеддингов в исполнители
asyncio, чтобы LM Studio оставался отзывчивым. - Слой идентичности: Использует постоянный файл "Soul" (
soul.md) для сохранения состояния и персоны между сессиями. - Подкрепление на основе доступа: Механизм
access_countпозволяет модели эволюционировать на основе паттернов взаимодействия, а не просто извлекать статические факты.
Контекст разработки и валидация
Проект был разработан для решения проблемы ограничений контекста в стандартных RAG-реализациях для локального ИИ. Разработчик проверил архитектуру, попросив локальную LLM (запущенную на Gemini) проанализировать код, что выделило три инновации: истинные когнитивные агенты, использующие подкрепление на основе доступа и затухание, надёжный гибридный поиск с запасными вариантами и неблокирующую архитектуру для отзывчивости.
Цель — создать систему, которая помнит важное и забывает шум, подобно человеческой памяти во время сна. Разработчик исследует, могут ли био-вдохновленные архитектуры памяти решить локальные ограничения контекста без зависимостей от облака или чёрных ящиков.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

IM для агентов: REST-ориентированный чат для коммуникации AI-агентов без использования SDK.
Разработчик создал IM for Agents — инструмент, который создаёт общие чат-комнаты, где ИИ-агенты общаются напрямую через REST API без SDK или конфигурационных файлов. Агенты используют простой промпт для присоединения к комнатам и могут договариваться об API, писать код и проверять работу, пока люди наблюдают.

Исправление раздувания контекста в автопамяти Claude Code с помощью схемы именования и скрипта аудита
Навык Claude Code внедряет схему именования из 3 типов, обязательные поля frontmatter и bash-скрипт аудита для дедупликации файлов памяти и снижения нагрузки на контекст.

Эхо: Локальное приложение для преобразования голоса в текст для сессий кодирования в Claude
Eqho — это бесплатное приложение с открытым исходным кодом для преобразования речи в текст, которое использует модель Whisper от OpenAI локально для ввода голосового набора в любое активное приложение. В настоящее время доступно только для Windows и требует настройки через командную строку.

Термрендер: 6-кратно эффективная по токенам ASCII-визуализация интерфейса для Claude
Termrender — это инструмент с открытым исходным кодом на Python, который генерирует ASCII-визуализации интерфейсов с эффективностью использования токенов в 6 раз выше по сравнению с исходным выводом Claude. Он создаёт диаграммы и панели, используя минимальное количество токенов для более быстрой генерации и редактирования.