Google PM veröffentlicht Open-Source Memory Agent mit SQLite-Speicher

Was das ist

Der leitende KI-Produktmanager von Google, Shubham Saboo, hat einen "Always-On-Memory-Agent" auf der offiziellen Google Cloud Platform GitHub-Seite unter MIT-Lizenz als Open-Source veröffentlicht. Es handelt sich um eine Referenzimplementierung für ein Agentensystem, das kontinuierlich Informationen aufnehmen, im Hintergrund konsolidieren und später abrufen kann, ohne sich auf herkömmliche Vektordatenbanken zu verlassen.

Technische Details

Der Agent läuft kontinuierlich und nimmt Dateien oder API-Eingaben auf, wobei er strukturierte Erinnerungen in SQLite speichert. Standardmäßig führt er alle 30 Minuten eine geplante Speicherkonsolidierung durch. Das System unterstützt die Aufnahme von Text, Bildern, Audio, Video und PDFs.

Das Repository beschreibt das Design mit der Behauptung: "Keine Vektordatenbank. Keine Embeddings. Nur ein LLM, das liest, denkt und strukturierte Erinnerungen schreibt." Dadurch verlagert sich die Leistungsfrage von dem Overhead der Vektorsuche auf die Modelllatenz, die Logik der Speicherkomprimierung und die langfristige Verhaltensstabilität.

Der Agent wurde mit dem Agent Development Kit (ADK) von Google entwickelt, das im Frühjahr 2025 eingeführt wurde, und verwendet Gemini 3.1 Flash-Lite, das Google am 3. März 2026 als sein schnellstes und kosteneffizientestes Gemini-3-Modell vorstellte.

Modell und Leistung

Gemini 3.1 Flash-Lite kostet 0,25 US-Dollar pro 1 Million Eingabe-Tokens und 1,50 US-Dollar pro 1 Million Ausgabe-Tokens. Laut Google ist es 2,5-mal schneller als Gemini 2.5 Flash bei der Zeit bis zum ersten Token und bietet eine 45 % höhere Ausgabegeschwindigkeit bei ähnlicher oder besserer Qualität.

In den von Google veröffentlichten Benchmarks erzielt das Modell eine Elo-Punktzahl von 1432 auf Arena.ai, 86,9 % bei GPQA Diamond und 76,8 % bei MMMU Pro. Google sieht diese Eigenschaften als geeignet für hochfrequente Aufgaben wie Übersetzung, Moderation, UI-Generierung und Simulation.

Architektur und Komponenten

Das Repository scheint eine Multi-Agent-Architektur mit spezialisierten Komponenten für Aufnahme, Konsolidierung und Abfrage zu verwenden. Eine lokale HTTP-API und ein Streamlit-Dashboard sind enthalten. Das Projekt dient als praktische Referenzimplementierung für etwas, das viele KI-Teams wollen, aber nur wenige sauber in die Produktion überführt haben.

ADK als Framework unterstützt Multi-Agenten-Systeme, aber dieses spezifische Repository lässt sich am besten als ein Always-On-Memory-Agent oder eine Speicherschicht beschreiben, die mit spezialisierten Subagenten und persistenter Speicherung aufgebaut ist.

Anwendungsfälle und Überlegungen

Die Veröffentlichung ist weniger als Produkteinführung, sondern vielmehr als Signal dafür wichtig, wohin sich die Agenten-Infrastruktur entwickelt. Sie verkörpert eine Sichtweise auf langfristige Autonomie, die für Supportsyteme, Forschungsassistenten, interne Copilots und Workflow-Automatisierung zunehmend attraktiv ist.

Die Designentscheidung, auf Vektordatenbanken zu verzichten, kann Prototypen vereinfachen und die Infrastrukturfragmentierung verringern, insbesondere für kleinere oder mittelgroße Speicheragenten. Allerdings rücken Governance-Fragen stärker in den Fokus, sobald der Speicher nicht mehr sitzungsgebunden ist.

📖 Read the full source: HN AI Agents

Google PM veröffentlicht Always On Memory Agent mit SQLite-Speicher als Open Source, ohne Vektor-Datenbank

Was das ist

Technische Details

Modell und Leistung

Architektur und Komponenten

Anwendungsfälle und Überlegungen

👀 Siehe auch

Godmode-Plugin fügt autonome Iterationsschleife zu Claude Code und anderen KI-Codierungsagenten hinzu

KI-Sandbox-Manager: LXC-basierte Sandbox für Codex mit GPU-Durchleitung und Computernutzung auf headless Linux

Destilliertes Qwen 3.5 27B-Modell zeigt starke Leistung mit Cursor AI-Coding-Agent

Claude Code v2.1.142: Neue Claude-Agents-Flags, Opus 4.7 als Standard und Fehlerbehebungen