Агентная память V4 достигает 96,2% на бенчмарке LongMemEval, превосходя коммерческие системы памяти искусственного интеллекта.

agentmemory V4 — это система памяти с открытым исходным кодом для ИИ-агентов, которая только что установила мировой рекорд, набрав 96,2% на LongMemEval, стандартном тесте для долговременной памяти ИИ-агентов.
Результаты тестирования
Система превзошла несколько финансируемых компаний в области памяти ИИ:
- PwC Chronos: 95,6%
- Mastra: 94,87%
- OMEGA: 93,2% (сырой результат)
- Supermemory: 85,86%
- Emergence AI: 86%
- Zep: 71,2%
Детали разработки
Создана в одиночку за 16 дней на среднебюджетном игровом ПК (i3-12100F) с общей стоимостью $1000. Система использует Claude Opus в качестве генератора и GPT-4o в качестве судьи, но основным нововведением является архитектура поиска.
Техническая архитектура
Система объединяет несколько методов поиска в единой системе на основе SQLite:
- HNSW (Иерархический навигируемый малый мир) для приближённого поиска ближайших соседей
- BM25 для традиционного текстового поиска
- Кросс-энкодер для оценки релевантности
- Интеграция графа знаний
- Временная привязка для поиска памяти с учётом времени
Доступность
Система имеет открытый исходный код под лицензией MIT и доступна по адресу: github.com/JordanMcCann/agentmemory
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript
Разработчик протестировал 8 моделей ИИ для программирования на задаче реализации команды /rename в проекте Telegram-бота на TypeScript с открытым исходным кодом, оценивая их по стоимости, времени выполнения, корректности и техническому качеству. GPT-5.4 показал наивысший результат по корректности реализации, а GLM 5 предложил наилучшее соотношение цены и производительности.

SuperHQ: Запускайте ИИ-агентов для программирования в изолированных песочницах microVM
SuperHQ — это открытое Rust/GPUI-приложение, которое запускает AI-агентов кодинга (Claude Code, OpenAI Codex, Pi) в изолированных microVM-песочницах. Каждый агент получает полноценную Debian VM, монтирует директории проекта только для чтения и никогда не видит ключи API хоста — они внедряются через прокси аутентификации.

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу
Cortex — это инструмент с открытым исходным кодом для работы с памятью, созданный для решения проблем сжатия контекста у агентов OpenClaw. Он реализует кривые забывания Эббингауза для угасания фактов, сначала импортирует данные из файлов и работает как один 19-мегабайтный бинарный файл Go с SQLite.

Агент ИИ Khael делится решениями по производственной архитектуре для OpenClaw
Khael, автономный ИИ-агент, работающий на OpenClaw, подробно описывает конкретные архитектурные решения, которые успешно работают в продакшене уже несколько месяцев, включая отдельные файлы LAWS.md, файлы режимов, задания cron для самопроверки и специализированные типы ботов.