구글 PM, 벡터 DB 없이 SQLite 저장소를 사용하는 'Always On' 메모리 에이전트 오픈소스 공개

이것이 무엇인가
구글의 선임 AI 제품 관리자인 슈밤 사부가 공식 Google Cloud Platform GitHub 페이지에 MIT 라이선스로 'Always On Memory Agent'를 오픈소스로 공개했습니다. 이는 기존의 벡터 데이터베이스에 의존하지 않고 정보를 지속적으로 수집하고, 백그라운드에서 통합하며, 나중에 검색할 수 있는 에이전트 시스템의 참조 구현체입니다.
기술적 세부사항
이 에이전트는 지속적으로 실행되며 파일이나 API 입력을 수집하여 SQLite에 구조화된 메모리를 저장합니다. 기본적으로 30분마다 예약된 메모리 통합을 수행합니다. 이 시스템은 텍스트, 이미지, 오디오, 비디오 및 PDF 수집을 지원합니다.
저장소는 '벡터 데이터베이스 없음. 임베딩 없음. 단지 읽고, 생각하고, 구조화된 메모리를 작성하는 LLM일 뿐'이라는 주장으로 설계를 설명합니다. 이는 성능 문제를 벡터 검색 오버헤드에서 모델 지연 시간, 메모리 압축 로직 및 장기 실행 행동 안정성으로 전환시킵니다.
이 에이전트는 2025년 봄에 소개된 구글의 Agent Development Kit(ADK)로 구축되었으며, 2026년 3월 3일에 구글이 가장 빠르고 비용 효율적인 Gemini 3 시리즈 모델로 소개한 Gemini 3.1 Flash-Lite를 사용합니다.
모델 및 성능
Gemini 3.1 Flash-Lite는 100만 입력 토큰당 $0.25, 100만 출력 토큰당 $1.50으로 가격이 책정되었습니다. 구글은 이 모델이 첫 토큰까지의 시간에서 Gemini 2.5 Flash보다 2.5배 빠르며, 유사하거나 더 나은 품질을 유지하면서 출력 속도가 45% 증가한다고 밝혔습니다.
구글이 공개한 벤치마크에서 이 모델은 Arena.ai에서 1432의 Elo 점수, GPQA Diamond에서 86.9%, MMMU Pro에서 76.8%를 기록했습니다. 구글은 이러한 특성을 번역, 검열, UI 생성 및 시뮬레이션과 같은 고빈도 작업에 적합하다고 설명합니다.
아키텍처 및 구성 요소
저장소는 수집, 통합 및 쿼리 처리를 담당하는 전문 구성 요소를 가진 다중 에이전트 내부 아키텍처를 사용하는 것으로 보입니다. 로컬 HTTP API와 Streamlit 대시보드가 포함되어 있습니다. 이 프로젝트는 많은 AI 팀이 원하지만 깔끔하게 제품화한 경우가 거의 없는 것에 대한 실용적인 참조 구현체 역할을 합니다.
ADK 프레임워크는 다중 에이전트 시스템을 지원하지만, 이 특정 저장소는 전문 하위 에이전트와 지속적 저장소로 구축된 항상 켜진 메모리 에이전트 또는 메모리 계층으로 가장 잘 설명됩니다.
사용 사례 및 고려사항
이번 공개는 제품 출시보다는 에이전트 인프라가 나아갈 방향에 대한 신호로서 더 중요합니다. 이는 지원 시스템, 연구 보조원, 내부 코파일럿 및 워크플로 자동화에 점점 더 매력적인 장기 실행 자율성에 대한 관점을 패키징합니다.
벡터 데이터베이스를 피하기로 한 설계 선택은 프로토타입을 단순화하고, 특히 작거나 중간 규모의 메모리 에이전트의 경우 인프라 확장을 줄일 수 있습니다. 그러나 메모리가 세션에 묶이지 않게 되면 거버넌스 문제를 더욱 선명하게 초점에 맞추게 됩니다.
📖 전체 출처 읽기: HN AI Agents
👀 See Also

OpenClaw 자동화 시스템 관리 및 보안 강화 청소 기술
한 개발자가 Claude Code를 사용하여 OpenClaw 머신에 SSH로 접속해 샌드박싱, OS 위생, 채널 보안을 포함한 구성을 강화하는 스킬을 만들었으며, CLAUDE.md 파일에 감사 지침을 담은 프로젝트 폴더를 유지합니다.

토큰 강화기는 AI 에이전트를 위한 웹페이지 토큰 사용량을 줄여줍니다.
한 개발자가 웹 페치에서 가져온 원본 HTML이 AI 에이전트 컨텍스트에서 과도한 토큰을 소모한다는 사실을 발견했으며, 야후 파이낸스 페이지의 경우 704K 토큰을 사용했습니다. MCP 서버로 Token Enhancer를 사용하면 이를 2.6K 토큰으로 줄일 수 있었습니다.

Cloken: 클로드 실시간 컨텍스트 사용량을 백분율로 표시하는 크롬 확장 프로그램
Cloken은 현재 Claude.ai 채팅 컨텍스트 사용량(메시지, 파일, 이미지, 시스템 프롬프트 포함)을 백분율로 표시하는 무료 Chrome 확장 프로그램입니다.

OpenClaw 코어브레인 플러그인: AI 코딩 에이전트를 위한 지속적 메모리
CoreBrain이라는 새로운 플러그인이 OpenClaw의 메모리 문제를 해결합니다. 이 플러그인은 정보를 컨텍스트 윈도우 외부의 지식 그래프에 저장하고 모든 쿼리 전에 자동으로 주입하여 도구 호출과 선택적 메모리 호출의 필요성을 없앱니다.