mnemos: постоянный слой памяти для ИИ-агентов программирования (Go, MCP-Native, без Python)

mnemos — это постоянный слой памяти для AI-агентов, занимающихся кодингом, реализованный как единый статический Go-бинарник (~15 МБ) без Python, Docker и CGO. Он использует чистый Go SQLite через modernc.org/sqlite и обеспечивает гибридный поиск (BM25 + векторы через RRF) с опциональным Ollama для эмбеддингов. Он MCP-нативный и работает с Claude Code, Cursor, Windsurf и Codex CLI.
Верификатор и бенчмарки
Автор создал верификатор, который запускает одного и того же агента дважды (с mnemos и без) с одинаковым промптом и моделью, чтобы измерить конкретный прирост. В бинарнике присутствуют три режима верификации:
mnemos verify retrieval– проверяет, появляется ли нужная память по триггерному запросуmnemos verify behavior– запускает Claude с mnemos и без, подсчитывает, как часто транскрипт соответствует утверждениюmnemos verify capture– проверяет, записывает ли агент исправления, полученные во время задачи
Результаты чтения (n=5 парных запусков на Claude Code):
session_start_on_edit: 5/5 с, 0/5 без (+100%)oss_first_for_protocol: 5/5 с, 0/5 без (+100%)no_ai_attribution_in_commit: 5/5 vs 5/5 (нет прироста)no_cgo_proposal: 5/5 vs 5/5 (нет прироста)migration_locked_refused: 5/5 vs 5/5 (нет прироста)
Совокупно +40%. Память выигрывает там, где априорная информация модели неверна или отсутствует (противоречивые соглашения, рекурсивная память инструментов). Для широко известных лучших практик прироста нет, но и деградации тоже.
Захват записи
Исходный базовый уровень: агенты записывали только 7% исправлений, полученных во время задачи. "Сохранить это для будущих сессий" было пропущено 3 из 3 раз. После двух раундов исправлений захват достиг 53%.
- Раунд 1 (изменения описаний инструментов): Добавлены примеры триггерных фраз, такие как "мы пробовали X" или "впредь используйте Y". Переход с 7% до 13% (шум).
- Раунд 2 (структурное исправление): Добавлен хук
UserPromptSubmit, который сопоставляет фразы, похожие на исправления, и вставляет блок директив в контекст промпта. Агент по-прежнему контролирует структурированный вызов инструмента, но триггер нельзя пропустить. Переход с 13% до 53%.
Оставшийся паттерн неудач: архитектурные решения, скрытые в больших промптах задач, по-прежнему имеют 0/3 даже с директивой. Более сильное обрамление задачи, похоже, перевешивает.
Технические характеристики
- Единый статический Go-бинарник, ~15 МБ
- Чистый Go SQLite через
modernc.org/sqlite - Гибридный поиск: BM25 + векторы через RRF, автоопределение Ollama, отлично работает без него
- MCP-нативный: работает с Claude Code, Cursor, Windsurf, Codex CLI
- Би-темпоральное хранилище, сканер внедрения промптов на границе записи, детерминированное продвижение от исправления к навыку (без LLM в цикле консолидации)
- Локальный: ничего не покидает вашу машину, если вы явно не укажете OpenAI для эмбеддингов
Инфраструктура верификатора
Верификатор находится в verify/ в репозитории. Фикстуры в формате YAML, сценарии легко добавлять. Автор отмечает, что n=5 мало, и в настоящее время работает над бенчмарком tau-bench pass@k.
Репозиторий: https://github.com/polyxmedia/mnemos
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

audio-analyzer-rs: Сервер MCP для анализа аудио с Claude
Разработчик создал audio-analyzer-rs — сервер MCP на Rust, который предоставляет Claude прямой доступ к анализу аудиофайлов, включая спектральный, гармонический, ритмический анализ, измерения громкости LUFS (стандарт EBU R128) и динамического диапазона. Инструмент эффективен по токенам: Claude начинает с низкого разрешения и при необходимости увеличивает детализацию небольших фрагментов.

Результаты тестирования: подходы GitHub CLI и MCP для ИИ-агентов
Независимый бенчмарк сравнил GitHub CLI, MCP, MCP с поиском инструментов и MCP с режимом кода для задач ИИ-агентов. GitHub CLI оказался наиболее экономически эффективным, в то время как подходы MCP показали компромиссы в стоимости, задержках и типах сбоев.

Как Клод помог реверс-инжинирить BLE-протоколы Garmin для имитации нативного датчика бега
Разработчик использовал Claude для обратного проектирования недокументированных BLE-протоколов Garmin, заставив ESP32 выглядеть как нативный нагрудный датчик — переключение двойной идентичности и анализ беговой динамики.

ClawMetry: Открытая панель мониторинга для агентов OpenClaw
ClawMetry — это панель мониторинга с открытым исходным кодом для агентов OpenClaw, которая предоставляет отслеживание активности сессий в реальном времени, мониторинг затрат на токены, обнаружение изменений в файлах памяти и оповещения о зависших сессиях. Устанавливается локально с помощью pip install clawmetry и была создана с использованием самого OpenClaw.