Google PM veröffentlicht Always On Memory Agent mit SQLite-Speicher als Open Source, ohne Vektor-Datenbank

Was das ist
Der leitende KI-Produktmanager von Google, Shubham Saboo, hat einen "Always-On-Memory-Agent" auf der offiziellen Google Cloud Platform GitHub-Seite unter MIT-Lizenz als Open-Source veröffentlicht. Es handelt sich um eine Referenzimplementierung für ein Agentensystem, das kontinuierlich Informationen aufnehmen, im Hintergrund konsolidieren und später abrufen kann, ohne sich auf herkömmliche Vektordatenbanken zu verlassen.
Technische Details
Der Agent läuft kontinuierlich und nimmt Dateien oder API-Eingaben auf, wobei er strukturierte Erinnerungen in SQLite speichert. Standardmäßig führt er alle 30 Minuten eine geplante Speicherkonsolidierung durch. Das System unterstützt die Aufnahme von Text, Bildern, Audio, Video und PDFs.
Das Repository beschreibt das Design mit der Behauptung: "Keine Vektordatenbank. Keine Embeddings. Nur ein LLM, das liest, denkt und strukturierte Erinnerungen schreibt." Dadurch verlagert sich die Leistungsfrage von dem Overhead der Vektorsuche auf die Modelllatenz, die Logik der Speicherkomprimierung und die langfristige Verhaltensstabilität.
Der Agent wurde mit dem Agent Development Kit (ADK) von Google entwickelt, das im Frühjahr 2025 eingeführt wurde, und verwendet Gemini 3.1 Flash-Lite, das Google am 3. März 2026 als sein schnellstes und kosteneffizientestes Gemini-3-Modell vorstellte.
Modell und Leistung
Gemini 3.1 Flash-Lite kostet 0,25 US-Dollar pro 1 Million Eingabe-Tokens und 1,50 US-Dollar pro 1 Million Ausgabe-Tokens. Laut Google ist es 2,5-mal schneller als Gemini 2.5 Flash bei der Zeit bis zum ersten Token und bietet eine 45 % höhere Ausgabegeschwindigkeit bei ähnlicher oder besserer Qualität.
In den von Google veröffentlichten Benchmarks erzielt das Modell eine Elo-Punktzahl von 1432 auf Arena.ai, 86,9 % bei GPQA Diamond und 76,8 % bei MMMU Pro. Google sieht diese Eigenschaften als geeignet für hochfrequente Aufgaben wie Übersetzung, Moderation, UI-Generierung und Simulation.
Architektur und Komponenten
Das Repository scheint eine Multi-Agent-Architektur mit spezialisierten Komponenten für Aufnahme, Konsolidierung und Abfrage zu verwenden. Eine lokale HTTP-API und ein Streamlit-Dashboard sind enthalten. Das Projekt dient als praktische Referenzimplementierung für etwas, das viele KI-Teams wollen, aber nur wenige sauber in die Produktion überführt haben.
ADK als Framework unterstützt Multi-Agenten-Systeme, aber dieses spezifische Repository lässt sich am besten als ein Always-On-Memory-Agent oder eine Speicherschicht beschreiben, die mit spezialisierten Subagenten und persistenter Speicherung aufgebaut ist.
Anwendungsfälle und Überlegungen
Die Veröffentlichung ist weniger als Produkteinführung, sondern vielmehr als Signal dafür wichtig, wohin sich die Agenten-Infrastruktur entwickelt. Sie verkörpert eine Sichtweise auf langfristige Autonomie, die für Supportsyteme, Forschungsassistenten, interne Copilots und Workflow-Automatisierung zunehmend attraktiv ist.
Die Designentscheidung, auf Vektordatenbanken zu verzichten, kann Prototypen vereinfachen und die Infrastrukturfragmentierung verringern, insbesondere für kleinere oder mittelgroße Speicheragenten. Allerdings rücken Governance-Fragen stärker in den Fokus, sobald der Speicher nicht mehr sitzungsgebunden ist.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Godmode-Plugin fügt autonome Iterationsschleife zu Claude Code und anderen KI-Codierungsagenten hinzu
Godmode ist ein Open-Source-Plugin, das Claude Code eine autonome Messen-Modifizieren-Verifizieren-Schleife hinzufügt, mit parallelen Agenten, Fehlerspeicher und 126 Fähigkeiten wie Optimierung, Sicherheitsaudits und TDD. Es funktioniert mit Cursor, Codex, Gemini CLI und OpenCode.

KI-Sandbox-Manager: LXC-basierte Sandbox für Codex mit GPU-Durchleitung und Computernutzung auf headless Linux
ai-sandbox-manager ist eine Open-Source-LXC-Sandbox für Codex-Agenten auf headless Linux. Sie bietet GPU-Durchleitung, vollständigen sudo-Zugriff, persistente Umgebungen und Computernutzung via CUA, während sie den Agenten vom Host-Betriebssystem isoliert.

Destilliertes Qwen 3.5 27B-Modell zeigt starke Leistung mit Cursor AI-Coding-Agent
Ein Nutzer berichtet, dass die destillierte Version 4.6 von Qwen 27B effektiv als Modell für Cursor funktioniert, mit einer Leistung, die mit Gemini 3 Flash vergleichbar ist. Die Einrichtung dauerte etwa 10 Minuten, wobei Cursor verwendet wurde, um den ngrok-Tunnel und localllama zu konfigurieren.

Claude Code v2.1.142: Neue Claude-Agents-Flags, Opus 4.7 als Standard und Fehlerbehebungen
Claude Code v2.1.142 fügt acht neue Flags zur Konfiguration von Hintergrundsitzungen hinzu, schaltet den Schnellmodus standardmäßig auf Opus 4.7 um und behebt über ein Dutzend Fehler, darunter MCP-Tool-Timeout, macOS-Schlaf-/Aufwach-Daemon-Probleme und Deadlocks bei Windows-Netzwerklaufwerken.