Google PM открывает исходный код Always On Memory Agent с хранением в SQLite, без векторной базы данных

Что это такое
Старший менеджер по продуктам искусственного интеллекта Google Шубхам Сабу открыл исходный код агента «Always On Memory Agent» на официальной странице Google Cloud Platform в GitHub под лицензией MIT. Это эталонная реализация системы агентов, которая может непрерывно обрабатывать информацию, консолидировать её в фоновом режиме и извлекать позже, не полагаясь на традиционные векторные базы данных.
Технические детали
Агент работает непрерывно, обрабатывает файлы или ввод через API, сохраняя структурированные воспоминания в SQLite. По умолчанию он выполняет запланированную консолидацию памяти каждые 30 минут. Система поддерживает обработку текста, изображений, аудио, видео и PDF.
В репозитории дизайн представлен с утверждением: «Никакой векторной базы данных. Никаких эмбеддингов. Просто LLM, которая читает, думает и записывает структурированную память». Это смещает вопрос производительности с накладных расходов векторного поиска на задержку модели, логику уплотнения памяти и стабильность поведения в долгосрочной перспективе.
Агент был создан с использованием набора для разработки агентов Google (ADK), представленного весной 2025 года, и использует Gemini 3.1 Flash-Lite, который Google представил 3 марта 2026 года как самую быструю и экономичную модель серии Gemini 3.
Модель и производительность
Gemini 3.1 Flash-Lite оценивается в $0,25 за 1 миллион входных токенов и $1,50 за 1 миллион выходных токенов. Google утверждает, что он в 2,5 раза быстрее, чем Gemini 2.5 Flash, по времени до первого токена и обеспечивает увеличение скорости вывода на 45%, сохраняя при этом аналогичное или лучшее качество.
Согласно опубликованным Google тестам, модель набирает 1432 балла по шкале Эло на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro. Google позиционирует эти характеристики как подходящие для высокочастотных задач, таких как перевод, модерация, генерация пользовательского интерфейса и симуляция.
Архитектура и компоненты
Похоже, что в репозитории используется многокомпонентная внутренняя архитектура со специализированными модулями, обрабатывающими ввод, консолидацию и запросы. Включены локальный HTTP API и панель управления Streamlit. Проект служит практической эталонной реализацией того, что хотят многие команды по ИИ, но немногие чисто внедрили в производство.
ADK как фреймворк поддерживает многоагентные системы, но этот конкретный репозиторий лучше всего описать как постоянно работающий агент памяти, или слой памяти, построенный со специализированными под-агентами и постоянным хранилищем.
Варианты использования и соображения
Этот релиз важен не столько как запуск продукта, сколько как сигнал о том, куда движется инфраструктура агентов. Он воплощает взгляд на долгосрочную автономность, которая становится всё более привлекательной для систем поддержки, исследовательских ассистентов, внутренних копилотов и автоматизации рабочих процессов.
Решение об отказе от векторных баз данных может упростить прототипы и сократить разрастание инфраструктуры, особенно для агентов с меньшим или средним объёмом памяти. Однако оно обостряет вопросы управления, как только память перестаёт быть привязанной к сессии.
📖 Read the full source: HN AI Agents
👀 Смотрите также

StarSteady: AI-управляемые ответы на отзывы Google и SMS-запросы для локального бизнеса
StarSteady — это созданный одним разработчиком SaaS-инструмент, который генерирует ответы на отзывы в Google/Yelp с помощью ИИ и отправляет SMS-запросы на отзывы клиентам. Цена начинается от $39 в месяц, доступен бесплатный пробный период на 5 ответов ИИ и 5 SMS.
TextExpander MCP Сервер Позволяет Claude AI Доступ к Вашей Библиотеке Сниппетов и Управление Ею
TextExpander запустил бесплатный MCP-сервер, который подключает вашу библиотеку сниппетов к Claude. Claude может массово перечислять, искать, создавать и редактировать сниппеты, включая динамические поля, такие как даты и выпадающие списки.

Самостоятельно размещенный контекстный бандит на Rust: Syntra и Lycan для адаптивных систем принятия решений
Два проекта с открытым исходным кодом: Lycan (язык выполнения графов с узлами стратегий и обученными весами) и Syntra (приложение Docker/API, обслуживающее скомпилированные капсулы Lycan). При использовании на собственном продукте для дебатов по AI-акциям обнаружили ошибки в конвейере данных до ошибок времени выполнения.

Миа: Локальный демон рабочего пространства ИИ с нативным приложением для Android и P2P-стримингом
Mia — это демон, который работает на вашем компьютере и соединяется с нативным Android-приложением через P2P, позволяя запускать и отслеживать длительные задачи ИИ-кодинга с телефона. Поддерживает агентов OpenCode, Claude Code, Gemini CLI и Codex, передавая вывод напрямую на ваше устройство в реальном времени.