LightMem: Облегченная система памяти для LLM-агентов с приростом производительности в 10+ раз и снижением затрат в 100 раз

LightMem: Практический слой памяти для агентов LLM
LightMem — это легковесная модульная система памяти для агентов LLM, которая решает проблемы длительных многоходовых взаимодействий, когда контекст становится зашумленным и дорогим, модели "теряются в середине", а существующие системы памяти добавляют задержку и стоимость токенов.
Как работает LightMem
Система поддерживает компактные, тематические и согласованные воспоминания с помощью трех ключевых механизмов:
- Предварительное сжатие сенсорной памяти: Фильтрует избыточные и малозначимые токены перед сохранением
- Тематическая кратковременная память: Группирует ходы по темам и суммирует их в точные единицы памяти
- Консолидация долговременной памяти во время простоя: Использует инкрементальные вставки во время выполнения плюс автономные высокоточные обновления без влияния на задержку
Результаты производительности
На бенчмарке LongMemEval LightMem показывает:
- Улучшение точности: до ~10,9%
- Сокращение токенов: до 117 раз
- Сокращение вызовов API: до 159 раз
- Сокращение времени выполнения: >12 раз
Последние обновления и функции
- Базовый фреймворк оценки для систем памяти (Mem0, A-MEM, LangMem) на LoCoMo и LongMemEval
- Демонстрационное видео и учебные блокноты для нескольких сценариев
- Интеграция с MCP Server для вызова памяти с несколькими инструментами
- Полная поддержка набора данных LoCoMo
- Интеграция с GLM-4.6 с воспроизводимыми скриптами
- Локальное развертывание через Ollama, vLLM, Transformers с функцией автоматической загрузки
Позиционирование и варианты использования
LightMem разработан как модульный слой памяти, который может интегрироваться с различными стеками агентов, включая:
- Агенты с длинным контекстом
- Агенты, использующие инструменты
- Автономные рабочие процессы
- Разговорные системы
Система предоставляет структурированную память, которая масштабируется без взрывного роста количества токенов, что делает её особенно полезной для разработчиков, работающих с фреймворками агентов, системами памяти/RAG, моделями с длинным контекстом и прикладными командами LLM.
Доступность
Статья: https://arxiv.org/abs/2510.18866
Код: https://github.com/zjunlp/LightMem
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

PACT: Программная система управления для Claude Code после сбоев в работе агентов
Разработчик создал PACT (Programmatic Agent Constraint Toolkit) после трёх месяцев повторяющихся сбоев Claude Code в мобильном приложении с более чем 350 файлами. Фреймворк заменяет неисполнимые правила механическими ограничениями, которые физически блокируют нарушения через предварительные хуки перед использованием инструментов.

Каркас Scaffold решает проблемы с памятью кода и рабочими процессами Claude
Scaffold — это 17-навыковый фреймворк для Claude Code, который обеспечивает постоянную память, принудительное принятие решений и контрольные точки рабочих процессов. Он использует 3-уровневую систему маршрутизации моделей для экономии токенов и может быть установлен через меню плагинов Claude Code.

嵌入Shell中的AI代理:终端缓冲与覆盖扩展
Оболочка с открытым исходным кодом и встроенным ИИ-агентом, который читает вывод терминала и вводит команды через плавающее наложение. Поддерживает локальные и облачные модели.

Навык OpenClaw 'Советы в ожидании' показывает обучающие подсказки во время ожидания ответа ИИ.
Навык 'Waiting Tips' для OpenClaw отправляет случайную обучающую подсказку сразу после отправки пользователем сообщения, заполняя 5-10 секунд ожидания ответа ИИ полезным контентом. Он включает 75 двуязычных подсказок в пяти категориях и работает на нескольких платформах для обмена сообщениями.