δ-Mem на Apple Silicon: реализация MLX и бенчмарки

Пользователь Reddit реализовал исследовательскую статью δ-mem (arXiv 2605.12357) для Apple Silicon с использованием mlx и интеграции OpenClaw. Статья улучшает направление внимания модели без контекста или LoRA, сообщая о 20% улучшении ответов в их тестах. Реализация использовала Qwen3-4B-Instruct через mlx и пользовательские адаптеры.

Результаты бенчмарков (нормализованные тесты mlx, Qwen3-4B-Instruct на MacMini 64GB):

Синтетические в стиле статьи: Plain 0.5129, δ-mem 0.5129 (1.00x)
LoCoMo-10 mini: Plain 0.0500, δ-mem 0.1833 (3.67x)
Воспроизведение OpenClaw: Plain 0.5701, δ-mem 0.6667 (1.17x)

Затраты по задержке (по сравнению с plain):

Синтетические: 1.013x
LoCoMo-10 mini: 1.33x запрос / 1.50x всего
Воспроизведение OpenClaw: 1.30x

Ключевые ссылки:

Репозиторий GitHub с адаптером: delta-mem-mlx-sidecar-w-openclaw
Адаптер MLX на Hugging Face: delta-mem-qwen3-4b-instruct-mlx-adapter

Выводы:

Синтетические тесты были плоскими (1.00x), но LoCoMo-mini показал сильные относительные улучшения (3.67x).
Воспроизведение в стиле OpenClaw показало практически значимое улучшение (6/8 → 7/8 тестов пройдено, 1.17x).
Пользователь отмечает, что Apple Silicon не может эффективно запускать CUDA, поэтому результаты ниже, чем в бенчмарках статьи. Бенчмарки статьи (Qwen3-4B-Instruct) показали в среднем 1.10x против замороженной основы, MemoryAgentBench 1.31x, LoCoMo 1.20x.
Пользователь ищет помощь (или финансирование ~$6k) для обучения адаптера для более крупных моделей, таких как Qwen3.6:27B.

Для кого это: Разработчики, запускающие локальных LLM-агентов на Apple Silicon, которые хотят экспериментировать с модуляцией весов δ-mem для улучшения производительности памяти/контекста.

📖 Читать полный источник: r/LocalLLaMA

Тестирование δ-Mem на Apple Silicon: реализация MLX и бенчмарки

👀 Смотрите также

Многооператорный Claude Code: Архитектура на основе хаба для многопользовательских сеансов

AIttache: MCP-сервер только для чтения, который не может уничтожить вашу продукцию

iai-mcp: Локальный демон обеспечивает Клоду постоянную память между сессиями с 99% точностью воспроизведения

Инструмент чтения Claude Code незаметно уменьшает изображения, вызывая галлюцинации