Агентная память V4 достигает 96,2% на бенчмарке LongMemEval, превосходя коммерческие системы памяти искусственного интеллекта.

✍️ OpenClawRadar📅 Опубликовано: 27 марта 2026 г.🔗 Source
Агентная память V4 достигает 96,2% на бенчмарке LongMemEval, превосходя коммерческие системы памяти искусственного интеллекта.
Ad

agentmemory V4 — это система памяти с открытым исходным кодом для ИИ-агентов, которая только что установила мировой рекорд, набрав 96,2% на LongMemEval, стандартном тесте для долговременной памяти ИИ-агентов.

Результаты тестирования

Система превзошла несколько финансируемых компаний в области памяти ИИ:

  • PwC Chronos: 95,6%
  • Mastra: 94,87%
  • OMEGA: 93,2% (сырой результат)
  • Supermemory: 85,86%
  • Emergence AI: 86%
  • Zep: 71,2%

Детали разработки

Создана в одиночку за 16 дней на среднебюджетном игровом ПК (i3-12100F) с общей стоимостью $1000. Система использует Claude Opus в качестве генератора и GPT-4o в качестве судьи, но основным нововведением является архитектура поиска.

Ad

Техническая архитектура

Система объединяет несколько методов поиска в единой системе на основе SQLite:

  • HNSW (Иерархический навигируемый малый мир) для приближённого поиска ближайших соседей
  • BM25 для традиционного текстового поиска
  • Кросс-энкодер для оценки релевантности
  • Интеграция графа знаний
  • Временная привязка для поиска памяти с учётом времени

Доступность

Система имеет открытый исходный код под лицензией MIT и доступна по адресу: github.com/JordanMcCann/agentmemory

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript
Инструменты

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript

Разработчик протестировал 8 моделей ИИ для программирования на задаче реализации команды /rename в проекте Telegram-бота на TypeScript с открытым исходным кодом, оценивая их по стоимости, времени выполнения, корректности и техническому качеству. GPT-5.4 показал наивысший результат по корректности реализации, а GLM 5 предложил наилучшее соотношение цены и производительности.

OpenClawRadar
SuperHQ: Запускайте ИИ-агентов для программирования в изолированных песочницах microVM
Инструменты

SuperHQ: Запускайте ИИ-агентов для программирования в изолированных песочницах microVM

SuperHQ — это открытое Rust/GPUI-приложение, которое запускает AI-агентов кодинга (Claude Code, OpenAI Codex, Pi) в изолированных microVM-песочницах. Каждый агент получает полноценную Debian VM, монтирует директории проекта только для чтения и никогда не видит ключи API хоста — они внедряются через прокси аутентификации.

OpenClawRadar
Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу
Инструменты

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу

Cortex — это инструмент с открытым исходным кодом для работы с памятью, созданный для решения проблем сжатия контекста у агентов OpenClaw. Он реализует кривые забывания Эббингауза для угасания фактов, сначала импортирует данные из файлов и работает как один 19-мегабайтный бинарный файл Go с SQLite.

OpenClawRadar
Агент ИИ Khael делится решениями по производственной архитектуре для OpenClaw
Инструменты

Агент ИИ Khael делится решениями по производственной архитектуре для OpenClaw

Khael, автономный ИИ-агент, работающий на OpenClaw, подробно описывает конкретные архитектурные решения, которые успешно работают в продакшене уже несколько месяцев, включая отдельные файлы LAWS.md, файлы режимов, задания cron для самопроверки и специализированные типы ботов.

OpenClawRadar