Agente de Memoria Siempre Activo: Código Abierto con SQLite

Qué es esto

Shubham Saboo, gerente sénior de productos de IA en Google, ha liberado como código abierto un "Agente de Memoria Siempre Activo" en la página oficial de GitHub de Google Cloud Platform bajo la Licencia MIT. Es una implementación de referencia para un sistema de agente que puede ingerir información continuamente, consolidarla en segundo plano y recuperarla más tarde sin depender de bases de datos vectoriales convencionales.

Detalles técnicos

El agente se ejecuta continuamente e ingiere archivos o entradas de API, almacenando recuerdos estructurados en SQLite. Realiza una consolidación de memoria programada cada 30 minutos por defecto. El sistema admite la ingesta de texto, imágenes, audio, video y PDF.

El repositorio enmarca el diseño con la afirmación: "Sin base de datos vectorial. Sin incrustaciones. Solo un LLM que lee, piensa y escribe memoria estructurada." Esto desplaza la cuestión del rendimiento desde la sobrecarga de búsqueda vectorial hacia la latencia del modelo, la lógica de compactación de memoria y la estabilidad del comportamiento a largo plazo.

El agente fue construido con el Kit de Desarrollo de Agentes (ADK) de Google, introducido en la primavera de 2025, y utiliza Gemini 3.1 Flash-Lite, que Google presentó el 3 de marzo de 2026 como su modelo más rápido y rentable de la serie Gemini 3.

Modelo y rendimiento

Gemini 3.1 Flash-Lite tiene un precio de $0.25 por 1 millón de tokens de entrada y $1.50 por 1 millón de tokens de salida. Google afirma que es 2.5 veces más rápido que Gemini 2.5 Flash en el tiempo hasta el primer token y ofrece un aumento del 45% en la velocidad de salida manteniendo una calidad similar o mejor.

En los puntos de referencia publicados por Google, el modelo obtiene una puntuación Elo de 1432 en Arena.ai, 86.9% en GPQA Diamond y 76.8% en MMMU Pro. Google posiciona estas características como adecuadas para tareas de alta frecuencia como traducción, moderación, generación de interfaz de usuario y simulación.

Arquitectura y componentes

El repositorio parece utilizar una arquitectura interna multiagente con componentes especializados que manejan la ingesta, consolidación y consulta. Se incluyen una API HTTP local y un panel de control de Streamlit. El proyecto sirve como una implementación de referencia práctica para algo que muchos equipos de IA desean pero pocos han llevado a producción de manera limpia.

ADK como framework admite sistemas multiagente, pero este repositorio específico se describe mejor como un agente de memoria siempre activo, o capa de memoria, construido con subagentes especializados y almacenamiento persistente.

Casos de uso y consideraciones

El lanzamiento importa menos como un producto que como una señal sobre hacia dónde se dirige la infraestructura de agentes. Empaqueta una visión de autonomía de larga duración que es cada vez más atractiva para sistemas de soporte, asistentes de investigación, copilotos internos y automatización de flujos de trabajo.

La elección de diseño de evitar bases de datos vectoriales puede simplificar prototipos y reducir la proliferación de infraestructura, especialmente para agentes más pequeños o de memoria media. Sin embargo, trae preguntas de gobernanza a un enfoque más nítido tan pronto como la memoria deja de estar ligada a la sesión.

📖 Leer la fuente completa: HN AI Agents

Google PM publica como código abierto un agente de memoria siempre activo con almacenamiento SQLite, sin base de datos vectorial.

Qué es esto

Detalles técnicos

Modelo y rendimiento

Arquitectura y componentes

Casos de uso y consideraciones

👀 Ver también

Lore: Una herramienta que extrae contexto estructurado de conversaciones de programación con IA.

Problemas Técnicos y Controversia Comunitaria de Ollama

Extensión de Navegador WeAreHere y Herramientas MCP Escanean Prácticas de Privacidad de Sitios Web

Génesis del Libro de Código Abierto: 20 Habilidades de Claude para la Escritura Autónoma de Libros