LightMem: Облегченная система памяти для LLM-агентов с приростом производительности в 10+ раз и снижением затрат в 100 раз

✍️ OpenClawRadar📅 Опубликовано: 26 февраля 2026 г.🔗 Source
LightMem: Облегченная система памяти для LLM-агентов с приростом производительности в 10+ раз и снижением затрат в 100 раз
Ad

LightMem: Практический слой памяти для агентов LLM

LightMem — это легковесная модульная система памяти для агентов LLM, которая решает проблемы длительных многоходовых взаимодействий, когда контекст становится зашумленным и дорогим, модели "теряются в середине", а существующие системы памяти добавляют задержку и стоимость токенов.

Как работает LightMem

Система поддерживает компактные, тематические и согласованные воспоминания с помощью трех ключевых механизмов:

  • Предварительное сжатие сенсорной памяти: Фильтрует избыточные и малозначимые токены перед сохранением
  • Тематическая кратковременная память: Группирует ходы по темам и суммирует их в точные единицы памяти
  • Консолидация долговременной памяти во время простоя: Использует инкрементальные вставки во время выполнения плюс автономные высокоточные обновления без влияния на задержку

Результаты производительности

На бенчмарке LongMemEval LightMem показывает:

  • Улучшение точности: до ~10,9%
  • Сокращение токенов: до 117 раз
  • Сокращение вызовов API: до 159 раз
  • Сокращение времени выполнения: >12 раз
Ad

Последние обновления и функции

  • Базовый фреймворк оценки для систем памяти (Mem0, A-MEM, LangMem) на LoCoMo и LongMemEval
  • Демонстрационное видео и учебные блокноты для нескольких сценариев
  • Интеграция с MCP Server для вызова памяти с несколькими инструментами
  • Полная поддержка набора данных LoCoMo
  • Интеграция с GLM-4.6 с воспроизводимыми скриптами
  • Локальное развертывание через Ollama, vLLM, Transformers с функцией автоматической загрузки

Позиционирование и варианты использования

LightMem разработан как модульный слой памяти, который может интегрироваться с различными стеками агентов, включая:

  • Агенты с длинным контекстом
  • Агенты, использующие инструменты
  • Автономные рабочие процессы
  • Разговорные системы

Система предоставляет структурированную память, которая масштабируется без взрывного роста количества токенов, что делает её особенно полезной для разработчиков, работающих с фреймворками агентов, системами памяти/RAG, моделями с длинным контекстом и прикладными командами LLM.

Доступность

Статья: https://arxiv.org/abs/2510.18866

Код: https://github.com/zjunlp/LightMem

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

PACT: Программная система управления для Claude Code после сбоев в работе агентов
Инструменты

PACT: Программная система управления для Claude Code после сбоев в работе агентов

Разработчик создал PACT (Programmatic Agent Constraint Toolkit) после трёх месяцев повторяющихся сбоев Claude Code в мобильном приложении с более чем 350 файлами. Фреймворк заменяет неисполнимые правила механическими ограничениями, которые физически блокируют нарушения через предварительные хуки перед использованием инструментов.

OpenClawRadar
Каркас Scaffold решает проблемы с памятью кода и рабочими процессами Claude
Инструменты

Каркас Scaffold решает проблемы с памятью кода и рабочими процессами Claude

Scaffold — это 17-навыковый фреймворк для Claude Code, который обеспечивает постоянную память, принудительное принятие решений и контрольные точки рабочих процессов. Он использует 3-уровневую систему маршрутизации моделей для экономии токенов и может быть установлен через меню плагинов Claude Code.

OpenClawRadar
嵌入Shell中的AI代理:终端缓冲与覆盖扩展
Инструменты

嵌入Shell中的AI代理:终端缓冲与覆盖扩展

Оболочка с открытым исходным кодом и встроенным ИИ-агентом, который читает вывод терминала и вводит команды через плавающее наложение. Поддерживает локальные и облачные модели.

OpenClawRadar
Навык OpenClaw 'Советы в ожидании' показывает обучающие подсказки во время ожидания ответа ИИ.
Инструменты

Навык OpenClaw 'Советы в ожидании' показывает обучающие подсказки во время ожидания ответа ИИ.

Навык 'Waiting Tips' для OpenClaw отправляет случайную обучающую подсказку сразу после отправки пользователем сообщения, заполняя 5-10 секунд ожидания ответа ИИ полезным контентом. Он включает 75 двуязычных подсказок в пяти категориях и работает на нескольких платформах для обмена сообщениями.

OpenClawRadar