Замена стандартной памяти OpenClaw на Redis и Qdrant для производственных мультиагентных систем

Масштабирование памяти OpenClaw для производственных многозадачных агентных систем
Разработчик, запускавший OpenClaw в производственной многозадачной системе на собственном VPS в течение двух месяцев, обнаружил, что стандартный слой памяти становится проблематичным при масштабировании. Хотя изначальный подход с Markdown и последующая память SQLite хорошо работают для локального использования, они не справляются с несколькими параллельно работающими агентами, сессиями, длящимися днями, и необходимостью агентов получать релевантный контекст из прошлой работы. Конкретные проблемы включали: отсутствие семантического поиска, невозможность обмена памятью между агентами и хаотичную параллельную запись.
Решение с архитектурой Redis + Qdrant
Разработчик перестроил систему памяти со следующей архитектурой:
- Redis для горячего временного состояния: текущая задача, недавнее контекстное окно, кэш вызовов инструментов с TTL
- Qdrant для постоянной векторной памяти: прошлые эпизоды, наблюдения, извлечённые знания
- Три коллекции в Qdrant: agent_episodes, agent_observations, agent_knowledge
- Обмен знаниями между агентами: эпизоды ограничены для каждого агента, в то время как знания доступны всем агентам
- Ранжирование с временным затуханием: предотвращает загрязнение поиска устаревшими воспоминаниями
- Redis pub/sub: используется для лёгкой передачи событий между агентами
- Пакетное внедрение + асинхронные обновления Qdrant: предотвращает блокировку цикла агента на записи
Детали реализации
Разработчик задокументировал полную реализацию, включая архитектурные решения, обоснование конфигурации HNSW, класс управления памятью, как они интегрировались в цикл наблюдений и стратегию очистки/удаления. Для моделей внедрения они используют text-embedding-3-small и рассматривали возможность полностью локального использования nomic-embed-text, но пока в этом не было необходимости.
📖 Прочитать полный источник: r/openclaw
👀 Смотрите также

Прокладывайте Claude Code через Ollama и сократите расходы на ~90%
Совместите Claude Desktop с Claude Code на базе Ollama: стратегические задачи остаются на Anthropic, тяжелые задания выполняются на бесплатных открытых моделях, таких как Gemma, Qwen, DeepSeek. Включает готовый к копированию промпт, который автоматизирует ~98% настройки.

Осваиваем навыки OpenClaw: пошаговое руководство
Раскройте полный потенциал OpenClaw с этим всесторонним руководством по созданию новых навыков. Узнайте ключевые стратегии для улучшения ваших проектов с помощью агентами ИИ-кодирования.

Использование паттерна Диспетчер для снижения затрат на API Claude на 95%
Разработчик сократил свои расходы на API Claude с $800–$2000/месяц до примерно $215/месяц, внедрив паттерн диспетчера, который делегирует тяжёлую работу в Claude Code CLI по подписке Claude Max, используя минимальное количество токенов API для оркестрации.
