Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания

✍️ OpenClawRadar📅 Опубликовано: 25 марта 2026 г.🔗 Source
Биовдохновленная система памяти для локальных LLM: реализация LTP и избирательного забывания
Ad

Био-вдохновленная архитектура памяти для локальных LLM

Разработчик создал локальный MCP-сервер, который имитирует механизмы человеческой памяти для поддержания чистого контекста локальных LLM. Система реализует три био-вдохновленных слоя на Python/TypeScript вместо статичного RAG-пайплайна.

Основные механизмы памяти

  • Подкрепление (Долговременная потенциация): Каждый раз, когда запрашивается тема, её access_count увеличивается, укрепляя часто используемые воспоминания.
  • Селективное забывание: Неиспользуемые связи со временем затухают, система автоматически архивирует слабые атомы, чтобы предотвратить загрязнение контекста.
  • Консолидация: Еженедельный цикл "сна" дистиллирует недавние логи в основные атомы знаний с использованием облегчённой SLM.

Технические детали реализации

  • Гибридный поиск: Сочетает sqlite-vec для семантического поиска с текстовыми запасными вариантами, чтобы предотвратить таймауты даже при сбое эмбеддингов.
  • Неблокирующий MCP: Оборачивает синхронные операции базы данных и эмбеддингов в исполнители asyncio, чтобы LM Studio оставался отзывчивым.
  • Слой идентичности: Использует постоянный файл "Soul" (soul.md) для сохранения состояния и персоны между сессиями.
  • Подкрепление на основе доступа: Механизм access_count позволяет модели эволюционировать на основе паттернов взаимодействия, а не просто извлекать статические факты.
Ad

Контекст разработки и валидация

Проект был разработан для решения проблемы ограничений контекста в стандартных RAG-реализациях для локального ИИ. Разработчик проверил архитектуру, попросив локальную LLM (запущенную на Gemini) проанализировать код, что выделило три инновации: истинные когнитивные агенты, использующие подкрепление на основе доступа и затухание, надёжный гибридный поиск с запасными вариантами и неблокирующую архитектуру для отзывчивости.

Цель — создать систему, которая помнит важное и забывает шум, подобно человеческой памяти во время сна. Разработчик исследует, могут ли био-вдохновленные архитектуры памяти решить локальные ограничения контекста без зависимостей от облака или чёрных ящиков.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.
Инструменты

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.

Бенчмарк 4 инструментов автоматизации браузера через CLI с использованием Claude Sonnet 4.6 на 6 реальных задачах показал, что все достигли 100% точности, но openbrowser-ai использовал 36 010 токенов, в то время как другие использовали 77 123–94 130 токенов. Количество вызовов инструментов оказалось самым сильным предиктором стоимости токенов.

OpenClawRadar
Hermes Agent v0.6.0 предлагает улучшенную поддержку локальных моделей с парсерами вызовов инструментов для каждой модели.
Инструменты

Hermes Agent v0.6.0 предлагает улучшенную поддержку локальных моделей с парсерами вызовов инструментов для каждой модели.

Hermes Agent v0.6.0 от Nous Research предоставляет парсеры вызовов инструментов для каждой модели, которые корректно обрабатывают вызовы инструментов на моделях класса 30B, поддерживает Ollama, vLLM и sglang из коробки, а также включает шесть серверных терминалов, включая Modal и Daytona для бессерверного развертывания.

OpenClawRadar
Сравнение Dual DGX Sparks и Mac Studio M3 Ultra: практический тест для локального запуска Qwen3.5 397B
Инструменты

Сравнение Dual DGX Sparks и Mac Studio M3 Ultra: практический тест для локального запуска Qwen3.5 397B

Разработчик сравнил локальный запуск Qwen3.5 397B на Mac Studio M3 Ultra 512GB за $10K и на настройке с двумя DGX Spark за $10K. Mac Studio показал 30-40 токенов/с с пропускной способностью памяти 800 ГБ/с, но медленным предзаполнением, в то время как Sparks выдавали 27-28 токенов/с с более быстрыми вычислениями, но сложной настройкой.

OpenClawRadar
Chat Saver CG: Браузерное расширение, созданное с помощью Claude, экспортирует беседы с 12 платформ ИИ
Инструменты

Chat Saver CG: Браузерное расширение, созданное с помощью Claude, экспортирует беседы с 12 платформ ИИ

Разработчик создал Chat Saver CG — расширение для браузера, которое экспортирует и переносит диалоги между Claude, ChatGPT, Gemini и 9 другими ИИ-платформами, активно используя Claude в процессе разработки, включая принятие архитектурных решений, отладку проблем с парсингом DOM и написание адаптерной логики.

OpenClawRadar