LightMem: Облегченная система памяти для LLM-агентов с приростом производительности в 10+ раз и снижением затрат в 100 раз

✍️ OpenClawRadar📅 Опубликовано: 26 февраля 2026 г.🔗 Source

LightMem: Практический слой памяти для агентов LLM

LightMem — это легковесная модульная система памяти для агентов LLM, которая решает проблемы длительных многоходовых взаимодействий, когда контекст становится зашумленным и дорогим, модели "теряются в середине", а существующие системы памяти добавляют задержку и стоимость токенов.

Как работает LightMem

Система поддерживает компактные, тематические и согласованные воспоминания с помощью трех ключевых механизмов:

Предварительное сжатие сенсорной памяти: Фильтрует избыточные и малозначимые токены перед сохранением
Тематическая кратковременная память: Группирует ходы по темам и суммирует их в точные единицы памяти
Консолидация долговременной памяти во время простоя: Использует инкрементальные вставки во время выполнения плюс автономные высокоточные обновления без влияния на задержку

Результаты производительности

На бенчмарке LongMemEval LightMem показывает:

Улучшение точности: до ~10,9%
Сокращение токенов: до 117 раз
Сокращение вызовов API: до 159 раз
Сокращение времени выполнения: >12 раз

Последние обновления и функции

Базовый фреймворк оценки для систем памяти (Mem0, A-MEM, LangMem) на LoCoMo и LongMemEval
Демонстрационное видео и учебные блокноты для нескольких сценариев
Интеграция с MCP Server для вызова памяти с несколькими инструментами
Полная поддержка набора данных LoCoMo
Интеграция с GLM-4.6 с воспроизводимыми скриптами
Локальное развертывание через Ollama, vLLM, Transformers с функцией автоматической загрузки

Позиционирование и варианты использования

LightMem разработан как модульный слой памяти, который может интегрироваться с различными стеками агентов, включая:

Агенты с длинным контекстом
Агенты, использующие инструменты
Автономные рабочие процессы
Разговорные системы

Система предоставляет структурированную память, которая масштабируется без взрывного роста количества токенов, что делает её особенно полезной для разработчиков, работающих с фреймворками агентов, системами памяти/RAG, моделями с длинным контекстом и прикладными командами LLM.

Доступность

Статья: https://arxiv.org/abs/2510.18866

Код: https://github.com/zjunlp/LightMem

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Результаты тестирования: 6 бюджетных моделей против Claude Sonnet 4.6 в задаче оркестрации OpenClaw

Разработчик протестировал шесть более дешёвых ИИ-моделей против Claude Sonnet 4.6 в качестве основного оркестратора для настройки OpenClaw. Только o4-mini повторил идеальный результат Sonnet, в то время как другие провалились на критически важных задачах, требующих суждения, таких как проверка файлов и делегирование.

17 мар. 2026 г., 07:45 UTC

OpenClawRadar

Инструменты

BusyDog Desktop: Локальный ИИ-агент с P2P-сетью для Mac

BusyDog Desktop — это локальный ИИ-агент, который запускает Claude прямо на вашем Mac. Он может читать и записывать файлы, выполнять терминальные команды, управлять браузерами и подключаться к другим агентам через P2P-сеть с использованием Hyperswarm DHT и пользовательского протокола BDP.

27 февр. 2026 г., 11:45 UTC

OpenClawRadar

Инструменты

Бесплатный инструмент для обнаружения сигналов фармаконадзора, созданный с помощью Claude Code.

Разработчик использовал Claude Code для создания бесплатной платформы фармаконадзора, которая анализирует 2,9 миллиона отчетов FDA о побочных эффектах, выполняя статистическое обнаружение сигналов, за которое коммерческие платформы берут $50–500 тысяч в год. Инструмент размещен бесплатно на HuggingFace.

30 мар. 2026 г., 14:45 UTC

OpenClawRadar

Инструменты

llm-use – Открытая платформа для маршрутизации и оркестрации многопоточных рабочих процессов агентов LLM.

llm-use революционизирует автоматизацию с помощью своей открытой архитектуры, разработанной для эффективной маршрутизации и организации рабочих процессов многоагентных LLM. Изучите его влияние на операции AI.

8 февр. 2026 г., 13:45 UTC

OpenClawRadar