Google PM открывает исходный код Always On Memory Agent с хранением в SQLite, без векторной базы данных

Что это такое
Старший менеджер по продуктам искусственного интеллекта Google Шубхам Сабу открыл исходный код агента «Always On Memory Agent» на официальной странице Google Cloud Platform в GitHub под лицензией MIT. Это эталонная реализация системы агентов, которая может непрерывно обрабатывать информацию, консолидировать её в фоновом режиме и извлекать позже, не полагаясь на традиционные векторные базы данных.
Технические детали
Агент работает непрерывно, обрабатывает файлы или ввод через API, сохраняя структурированные воспоминания в SQLite. По умолчанию он выполняет запланированную консолидацию памяти каждые 30 минут. Система поддерживает обработку текста, изображений, аудио, видео и PDF.
В репозитории дизайн представлен с утверждением: «Никакой векторной базы данных. Никаких эмбеддингов. Просто LLM, которая читает, думает и записывает структурированную память». Это смещает вопрос производительности с накладных расходов векторного поиска на задержку модели, логику уплотнения памяти и стабильность поведения в долгосрочной перспективе.
Агент был создан с использованием набора для разработки агентов Google (ADK), представленного весной 2025 года, и использует Gemini 3.1 Flash-Lite, который Google представил 3 марта 2026 года как самую быструю и экономичную модель серии Gemini 3.
Модель и производительность
Gemini 3.1 Flash-Lite оценивается в $0,25 за 1 миллион входных токенов и $1,50 за 1 миллион выходных токенов. Google утверждает, что он в 2,5 раза быстрее, чем Gemini 2.5 Flash, по времени до первого токена и обеспечивает увеличение скорости вывода на 45%, сохраняя при этом аналогичное или лучшее качество.
Согласно опубликованным Google тестам, модель набирает 1432 балла по шкале Эло на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro. Google позиционирует эти характеристики как подходящие для высокочастотных задач, таких как перевод, модерация, генерация пользовательского интерфейса и симуляция.
Архитектура и компоненты
Похоже, что в репозитории используется многокомпонентная внутренняя архитектура со специализированными модулями, обрабатывающими ввод, консолидацию и запросы. Включены локальный HTTP API и панель управления Streamlit. Проект служит практической эталонной реализацией того, что хотят многие команды по ИИ, но немногие чисто внедрили в производство.
ADK как фреймворк поддерживает многоагентные системы, но этот конкретный репозиторий лучше всего описать как постоянно работающий агент памяти, или слой памяти, построенный со специализированными под-агентами и постоянным хранилищем.
Варианты использования и соображения
Этот релиз важен не столько как запуск продукта, сколько как сигнал о том, куда движется инфраструктура агентов. Он воплощает взгляд на долгосрочную автономность, которая становится всё более привлекательной для систем поддержки, исследовательских ассистентов, внутренних копилотов и автоматизации рабочих процессов.
Решение об отказе от векторных баз данных может упростить прототипы и сократить разрастание инфраструктуры, особенно для агентов с меньшим или средним объёмом памяти. Однако оно обостряет вопросы управления, как только память перестаёт быть привязанной к сессии.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Результаты PinchBench: Первый эталонный тест для ИИ-агентов кодирования, специфичных для OpenClaw
Первый специализированный бенчмарк OpenClaw, PinchBench, ранжирует 32 модели ИИ по проценту успешных решений, стоимости и скорости, где Google Gemini-3-Flash-Preview лидирует с 95,1% успеха за $0,72.

Открытый Плагин GTM для Claude Code с 166 Маркетинговыми Навыками и Командой Bootstrap
Разработчик выпустил плагин Go-To-Market с открытым исходным кодом для Claude Code, который предоставляет 166 специализированных маркетинговых навыков в областях SEO, контента, исходящего маркетинга, продаж, роста, аналитики, стратегии, рекламы, социальных сетей, CRM и AI-поиска. Плагин включает команду /bootstrap, которая проводит опрос пользователей об их бренде для создания персонализированных контекстных файлов.

Открытый MCP-сервер соединяет Claude Code с инструментами IDE
Открытый сервер MCP предоставляет Claude Code постоянный доступ к функциям IDE, включая LSP, терминалы, Git, GitHub, отладку и диагностику через 124+ инструментов. Он позволяет программировать с мобильных устройств при настройке машины.

Claude Code получает проверку моделей TLA+ через MCP-сервер tla-mcp
tla-mcp — это новый MCP-сервер, который позволяет Claude Code вызывать модель-чекер TLA+ tla-rs как первоклассный инструмент: проверять спецификации, выполнять ограниченные проверки с трассировкой контрпримеров и воспроизводить сценарии прямо из чата.