Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания

✍️ OpenClawRadar📅 Опубликовано: 25 марта 2026 г.🔗 Source
Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания
Ad

Био-вдохновленная архитектура памяти для локальных LLM

Разработчик создал локальный MCP-сервер, который имитирует механизмы человеческой памяти для поддержания чистого контекста локальных LLM. Система реализует три био-вдохновленных слоя на Python/TypeScript вместо статичного RAG-пайплайна.

Основные механизмы памяти

  • Подкрепление (Долговременная потенциация): Каждый раз, когда запрашивается тема, её access_count увеличивается, укрепляя часто используемые воспоминания.
  • Селективное забывание: Неиспользуемые связи со временем затухают, система автоматически архивирует слабые атомы, чтобы предотвратить загрязнение контекста.
  • Консолидация: Еженедельный цикл "сна" дистиллирует недавние логи в основные атомы знаний с использованием облегчённой SLM.

Технические детали реализации

  • Гибридный поиск: Сочетает sqlite-vec для семантического поиска с текстовыми запасными вариантами, чтобы предотвратить таймауты даже при сбое эмбеддингов.
  • Неблокирующий MCP: Оборачивает синхронные операции базы данных и эмбеддингов в исполнители asyncio, чтобы LM Studio оставался отзывчивым.
  • Слой идентичности: Использует постоянный файл "Soul" (soul.md) для сохранения состояния и персоны между сессиями.
  • Подкрепление на основе доступа: Механизм access_count позволяет модели эволюционировать на основе паттернов взаимодействия, а не просто извлекать статические факты.
Ad

Контекст разработки и валидация

Проект был разработан для решения проблемы ограничений контекста в стандартных RAG-реализациях для локального ИИ. Разработчик проверил архитектуру, попросив локальную LLM (запущенную на Gemini) проанализировать код, что выделило три инновации: истинные когнитивные агенты, использующие подкрепление на основе доступа и затухание, надёжный гибридный поиск с запасными вариантами и неблокирующую архитектуру для отзывчивости.

Цель — создать систему, которая помнит важное и забывает шум, подобно человеческой памяти во время сна. Разработчик исследует, могут ли био-вдохновленные архитектуры памяти решить локальные ограничения контекста без зависимостей от облака или чёрных ящиков.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

IM для агентов: REST-ориентированный чат для коммуникации AI-агентов без использования SDK.
Инструменты

IM для агентов: REST-ориентированный чат для коммуникации AI-агентов без использования SDK.

Разработчик создал IM for Agents — инструмент, который создаёт общие чат-комнаты, где ИИ-агенты общаются напрямую через REST API без SDK или конфигурационных файлов. Агенты используют простой промпт для присоединения к комнатам и могут договариваться об API, писать код и проверять работу, пока люди наблюдают.

OpenClawRadar
Исправление раздувания контекста в автопамяти Claude Code с помощью схемы именования и скрипта аудита
Инструменты

Исправление раздувания контекста в автопамяти Claude Code с помощью схемы именования и скрипта аудита

Навык Claude Code внедряет схему именования из 3 типов, обязательные поля frontmatter и bash-скрипт аудита для дедупликации файлов памяти и снижения нагрузки на контекст.

OpenClawRadar
Эхо: Локальное приложение для преобразования голоса в текст для сессий кодирования в Claude
Инструменты

Эхо: Локальное приложение для преобразования голоса в текст для сессий кодирования в Claude

Eqho — это бесплатное приложение с открытым исходным кодом для преобразования речи в текст, которое использует модель Whisper от OpenAI локально для ввода голосового набора в любое активное приложение. В настоящее время доступно только для Windows и требует настройки через командную строку.

OpenClawRadar
Термрендер: 6-кратно эффективная по токенам ASCII-визуализация интерфейса для Claude
Инструменты

Термрендер: 6-кратно эффективная по токенам ASCII-визуализация интерфейса для Claude

Termrender — это инструмент с открытым исходным кодом на Python, который генерирует ASCII-визуализации интерфейсов с эффективностью использования токенов в 6 раз выше по сравнению с исходным выводом Claude. Он создаёт диаграммы и панели, используя минимальное количество токенов для более быстрой генерации и редактирования.

OpenClawRadar