mnemos: постоянный слой памяти для ИИ-агентов программирования (Go, MCP-Native, без Python)

✍️ OpenClawRadar📅 Опубликовано: 8 мая 2026 г.🔗 Source

mnemos — это постоянный слой памяти для AI-агентов, занимающихся кодингом, реализованный как единый статический Go-бинарник (~15 МБ) без Python, Docker и CGO. Он использует чистый Go SQLite через modernc.org/sqlite и обеспечивает гибридный поиск (BM25 + векторы через RRF) с опциональным Ollama для эмбеддингов. Он MCP-нативный и работает с Claude Code, Cursor, Windsurf и Codex CLI.

Верификатор и бенчмарки

Автор создал верификатор, который запускает одного и того же агента дважды (с mnemos и без) с одинаковым промптом и моделью, чтобы измерить конкретный прирост. В бинарнике присутствуют три режима верификации:

mnemos verify retrieval – проверяет, появляется ли нужная память по триггерному запросу
mnemos verify behavior – запускает Claude с mnemos и без, подсчитывает, как часто транскрипт соответствует утверждению
mnemos verify capture – проверяет, записывает ли агент исправления, полученные во время задачи

Результаты чтения (n=5 парных запусков на Claude Code):

session_start_on_edit: 5/5 с, 0/5 без (+100%)
oss_first_for_protocol: 5/5 с, 0/5 без (+100%)
no_ai_attribution_in_commit: 5/5 vs 5/5 (нет прироста)
no_cgo_proposal: 5/5 vs 5/5 (нет прироста)
migration_locked_refused: 5/5 vs 5/5 (нет прироста)

Совокупно +40%. Память выигрывает там, где априорная информация модели неверна или отсутствует (противоречивые соглашения, рекурсивная память инструментов). Для широко известных лучших практик прироста нет, но и деградации тоже.

Захват записи

Исходный базовый уровень: агенты записывали только 7% исправлений, полученных во время задачи. "Сохранить это для будущих сессий" было пропущено 3 из 3 раз. После двух раундов исправлений захват достиг 53%.

Раунд 1 (изменения описаний инструментов): Добавлены примеры триггерных фраз, такие как "мы пробовали X" или "впредь используйте Y". Переход с 7% до 13% (шум).
Раунд 2 (структурное исправление): Добавлен хук UserPromptSubmit, который сопоставляет фразы, похожие на исправления, и вставляет блок директив в контекст промпта. Агент по-прежнему контролирует структурированный вызов инструмента, но триггер нельзя пропустить. Переход с 13% до 53%.

Оставшийся паттерн неудач: архитектурные решения, скрытые в больших промптах задач, по-прежнему имеют 0/3 даже с директивой. Более сильное обрамление задачи, похоже, перевешивает.

Технические характеристики

Единый статический Go-бинарник, ~15 МБ
Чистый Go SQLite через modernc.org/sqlite
Гибридный поиск: BM25 + векторы через RRF, автоопределение Ollama, отлично работает без него
MCP-нативный: работает с Claude Code, Cursor, Windsurf, Codex CLI
Би-темпоральное хранилище, сканер внедрения промптов на границе записи, детерминированное продвижение от исправления к навыку (без LLM в цикле консолидации)
Локальный: ничего не покидает вашу машину, если вы явно не укажете OpenAI для эмбеддингов

Инфраструктура верификатора

Верификатор находится в verify/ в репозитории. Фикстуры в формате YAML, сценарии легко добавлять. Автор отмечает, что n=5 мало, и в настоящее время работает над бенчмарком tau-bench pass@k.

Репозиторий: https://github.com/polyxmedia/mnemos

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

audio-analyzer-rs: Сервер MCP для анализа аудио с Claude

Разработчик создал audio-analyzer-rs — сервер MCP на Rust, который предоставляет Claude прямой доступ к анализу аудиофайлов, включая спектральный, гармонический, ритмический анализ, измерения громкости LUFS (стандарт EBU R128) и динамического диапазона. Инструмент эффективен по токенам: Claude начинает с низкого разрешения и при необходимости увеличивает детализацию небольших фрагментов.

12 мар. 2026 г., 17:45 UTC

OpenClawRadar

Инструменты

Результаты тестирования: подходы GitHub CLI и MCP для ИИ-агентов

Независимый бенчмарк сравнил GitHub CLI, MCP, MCP с поиском инструментов и MCP с режимом кода для задач ИИ-агентов. GitHub CLI оказался наиболее экономически эффективным, в то время как подходы MCP показали компромиссы в стоимости, задержках и типах сбоев.

28 мар. 2026 г., 20:45 UTC

OpenClawRadar

Инструменты

Как Клод помог реверс-инжинирить BLE-протоколы Garmin для имитации нативного датчика бега

Разработчик использовал Claude для обратного проектирования недокументированных BLE-протоколов Garmin, заставив ESP32 выглядеть как нативный нагрудный датчик — переключение двойной идентичности и анализ беговой динамики.

23 июн. 2026 г., 12:20 UTC

OpenClawRadar

Инструменты

ClawMetry: Открытая панель мониторинга для агентов OpenClaw

ClawMetry — это панель мониторинга с открытым исходным кодом для агентов OpenClaw, которая предоставляет отслеживание активности сессий в реальном времени, мониторинг затрат на токены, обнаружение изменений в файлах памяти и оповещения о зависших сессиях. Устанавливается локально с помощью pip install clawmetry и была создана с использованием самого OpenClaw.

2 апр. 2026 г., 09:45 UTC

OpenClawRadar