Google PM publica como código abierto un agente de memoria siempre activo con almacenamiento SQLite, sin base de datos vectorial.

Qué es esto
Shubham Saboo, gerente sénior de productos de IA en Google, ha liberado como código abierto un "Agente de Memoria Siempre Activo" en la página oficial de GitHub de Google Cloud Platform bajo la Licencia MIT. Es una implementación de referencia para un sistema de agente que puede ingerir información continuamente, consolidarla en segundo plano y recuperarla más tarde sin depender de bases de datos vectoriales convencionales.
Detalles técnicos
El agente se ejecuta continuamente e ingiere archivos o entradas de API, almacenando recuerdos estructurados en SQLite. Realiza una consolidación de memoria programada cada 30 minutos por defecto. El sistema admite la ingesta de texto, imágenes, audio, video y PDF.
El repositorio enmarca el diseño con la afirmación: "Sin base de datos vectorial. Sin incrustaciones. Solo un LLM que lee, piensa y escribe memoria estructurada." Esto desplaza la cuestión del rendimiento desde la sobrecarga de búsqueda vectorial hacia la latencia del modelo, la lógica de compactación de memoria y la estabilidad del comportamiento a largo plazo.
El agente fue construido con el Kit de Desarrollo de Agentes (ADK) de Google, introducido en la primavera de 2025, y utiliza Gemini 3.1 Flash-Lite, que Google presentó el 3 de marzo de 2026 como su modelo más rápido y rentable de la serie Gemini 3.
Modelo y rendimiento
Gemini 3.1 Flash-Lite tiene un precio de $0.25 por 1 millón de tokens de entrada y $1.50 por 1 millón de tokens de salida. Google afirma que es 2.5 veces más rápido que Gemini 2.5 Flash en el tiempo hasta el primer token y ofrece un aumento del 45% en la velocidad de salida manteniendo una calidad similar o mejor.
En los puntos de referencia publicados por Google, el modelo obtiene una puntuación Elo de 1432 en Arena.ai, 86.9% en GPQA Diamond y 76.8% en MMMU Pro. Google posiciona estas características como adecuadas para tareas de alta frecuencia como traducción, moderación, generación de interfaz de usuario y simulación.
Arquitectura y componentes
El repositorio parece utilizar una arquitectura interna multiagente con componentes especializados que manejan la ingesta, consolidación y consulta. Se incluyen una API HTTP local y un panel de control de Streamlit. El proyecto sirve como una implementación de referencia práctica para algo que muchos equipos de IA desean pero pocos han llevado a producción de manera limpia.
ADK como framework admite sistemas multiagente, pero este repositorio específico se describe mejor como un agente de memoria siempre activo, o capa de memoria, construido con subagentes especializados y almacenamiento persistente.
Casos de uso y consideraciones
El lanzamiento importa menos como un producto que como una señal sobre hacia dónde se dirige la infraestructura de agentes. Empaqueta una visión de autonomía de larga duración que es cada vez más atractiva para sistemas de soporte, asistentes de investigación, copilotos internos y automatización de flujos de trabajo.
La elección de diseño de evitar bases de datos vectoriales puede simplificar prototipos y reducir la proliferación de infraestructura, especialmente para agentes más pequeños o de memoria media. Sin embargo, trae preguntas de gobernanza a un enfoque más nítido tan pronto como la memoria deja de estar ligada a la sesión.
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

Claude Skills: 12 Paquetes Estrictos de Reglas de Codificación para TypeScript, Rust, Swift, Go, JS, Postgres y Auditorías.
12 archivos markdown con reglas opinadas y conscientes de la versión para TS, Rust, Swift, Go, JS, Postgres, seguridad, rendimiento, pruebas, revisión de código, estándares de GitHub y commits de git. MIT, gratis, sin registro.

Kanwas: Tablero de contexto compartido de código abierto para equipos y agentes de IA
Kanwas es un espacio de trabajo multijugador de código abierto donde equipos y agentes de IA comparten documentos, evidencia y decisiones en un lienzo con transmisión en vivo de llamadas a herramientas. Alojado localmente mediante Docker, con respaldo en Git mediante Yjs y BlockNote.

Sistemas de Decisión Adaptativa con Bandido Contextual Autoalojado en Rust: Syntra y Lycan
Dos proyectos de código abierto: Lycan (lenguaje de ejecución de grafos con nodos de estrategia y pesos aprendidos) y Syntra (aparato Docker/API que sirve cápsulas Lycan compiladas). Encontraron errores en el pipeline de datos antes que errores en tiempo de ejecución al probar internamente un producto de debate bursátil con IA.

Holaboss AI Runtime se traslada a TypeScript, implementa puertos MCP persistentes.
El entorno de ejecución del agente local Holaboss AI ha sido reestructurado para usar TypeScript exclusivamente, eliminando dependencias de Python y reduciendo el tamaño del paquete. Ahora persiste los puertos del servidor MCP en SQLite con restricciones UNIQUE(port) para evitar colisiones entre reinicios.