Google PM publica como código abierto un agente de memoria siempre activo con almacenamiento SQLite, sin base de datos vectorial.

Qué es esto
Shubham Saboo, gerente sénior de productos de IA en Google, ha liberado como código abierto un "Agente de Memoria Siempre Activo" en la página oficial de GitHub de Google Cloud Platform bajo la Licencia MIT. Es una implementación de referencia para un sistema de agente que puede ingerir información continuamente, consolidarla en segundo plano y recuperarla más tarde sin depender de bases de datos vectoriales convencionales.
Detalles técnicos
El agente se ejecuta continuamente e ingiere archivos o entradas de API, almacenando recuerdos estructurados en SQLite. Realiza una consolidación de memoria programada cada 30 minutos por defecto. El sistema admite la ingesta de texto, imágenes, audio, video y PDF.
El repositorio enmarca el diseño con la afirmación: "Sin base de datos vectorial. Sin incrustaciones. Solo un LLM que lee, piensa y escribe memoria estructurada." Esto desplaza la cuestión del rendimiento desde la sobrecarga de búsqueda vectorial hacia la latencia del modelo, la lógica de compactación de memoria y la estabilidad del comportamiento a largo plazo.
El agente fue construido con el Kit de Desarrollo de Agentes (ADK) de Google, introducido en la primavera de 2025, y utiliza Gemini 3.1 Flash-Lite, que Google presentó el 3 de marzo de 2026 como su modelo más rápido y rentable de la serie Gemini 3.
Modelo y rendimiento
Gemini 3.1 Flash-Lite tiene un precio de $0.25 por 1 millón de tokens de entrada y $1.50 por 1 millón de tokens de salida. Google afirma que es 2.5 veces más rápido que Gemini 2.5 Flash en el tiempo hasta el primer token y ofrece un aumento del 45% en la velocidad de salida manteniendo una calidad similar o mejor.
En los puntos de referencia publicados por Google, el modelo obtiene una puntuación Elo de 1432 en Arena.ai, 86.9% en GPQA Diamond y 76.8% en MMMU Pro. Google posiciona estas características como adecuadas para tareas de alta frecuencia como traducción, moderación, generación de interfaz de usuario y simulación.
Arquitectura y componentes
El repositorio parece utilizar una arquitectura interna multiagente con componentes especializados que manejan la ingesta, consolidación y consulta. Se incluyen una API HTTP local y un panel de control de Streamlit. El proyecto sirve como una implementación de referencia práctica para algo que muchos equipos de IA desean pero pocos han llevado a producción de manera limpia.
ADK como framework admite sistemas multiagente, pero este repositorio específico se describe mejor como un agente de memoria siempre activo, o capa de memoria, construido con subagentes especializados y almacenamiento persistente.
Casos de uso y consideraciones
El lanzamiento importa menos como un producto que como una señal sobre hacia dónde se dirige la infraestructura de agentes. Empaqueta una visión de autonomía de larga duración que es cada vez más atractiva para sistemas de soporte, asistentes de investigación, copilotos internos y automatización de flujos de trabajo.
La elección de diseño de evitar bases de datos vectoriales puede simplificar prototipos y reducir la proliferación de infraestructura, especialmente para agentes más pequeños o de memoria media. Sin embargo, trae preguntas de gobernanza a un enfoque más nítido tan pronto como la memoria deja de estar ligada a la sesión.
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

Lore: Una herramienta que extrae contexto estructurado de conversaciones de programación con IA.
Lore es una herramienta basada en navegador creada con Claude Code que extrae contexto estructurado de conversaciones de IA, capturando decisiones, pendientes, bloqueos y listas de verificación para retomar. Es una PWA de React + TypeScript con una extensión de Chrome para capturar conversaciones directamente e inyectar contexto.

Problemas Técnicos y Controversia Comunitaria de Ollama
Ollama, una popular herramienta local de LLM, enfrenta críticas por minimizar su dependencia de llama.cpp, problemas de cumplimiento de licencias y problemas técnicos con su backend personalizado, incluyendo regresiones de rendimiento y errores reintroducidos.

Extensión de Navegador WeAreHere y Herramientas MCP Escanean Prácticas de Privacidad de Sitios Web
Dos herramientas de código abierto—barebrowse y wearehere—escanean sitios web en busca de rastreadores, huellas digitales y conexiones con corredores de datos. La extensión de navegador wearehere muestra puntuaciones de privacidad en tiempo real (0-100) mientras navegas, mientras que los servidores MCP permiten que los asistentes de IA evalúen cualquier sitio bajo demanda.

Génesis del Libro de Código Abierto: 20 Habilidades de Claude para la Escritura Autónoma de Libros
Book Genesis es un sistema de código abierto de 20 habilidades especializadas de Claude Code que toma una idea de libro y produce un manuscrito completo listo para publicar a través de una tubería autónoma de 14 fases. Incluye un 'Motor del Caos' para romper patrones de previsibilidad de la IA y ha generado una memoria de 68,000 palabras que obtuvo una puntuación de 9.0/10 en su Genesis Score.