Lokale semantische Gedächtnissuche: Harrier + OpenClaw Konfiguration

Ein neues Repository zeigt, wie man einem OpenClaw-Agenten eine lokale semantische Gedächtnissuche ohne das Senden von Embeddings an einen externen Dienst ermöglicht. Der Ansatz betreibt einen kleinen lokalen Embedding-Server auf Basis von Microsofts Harrier-Modell (microsoft/harrier-oss-v1-0.6b), stellt eine Ollama-kompatible API bereit und verbindet diese mit OpenClaws memorySearch-Konfiguration.

Wie es funktioniert

Der Embedding-Server führt Harrier lokal aus und bietet die Endpunkte /api/embed und /api/embeddings an, die dem API-Format von Ollama entsprechen. OpenClaws memorySearch unterstützt bereits Ollama-ähnliche Endpunkte, daher genügt es, auf http://localhost:8000 zu verweisen, um dem Agenten eine lokale, hochmoderne semantische Gedächtnisschicht zu geben.

Warum dies für das Agentengedächtnis wichtig ist

Die meisten Agent-Gedächtnissysteme haben zwei Schwachstellen:

Zu viel Gedächtnis in den Prompt zu stopfen, verbrennt Tokens und macht den Kontext unübersichtlich.
Gedächtnisdateien klein und manuell zu halten, wird mit wachsender Historie schwer wartbar.

Die semantische Gedächtnissuche bietet einen Mittelweg. Das Langzeitgedächtnis bleibt in normalen Markdown-Dateien (MEMORY.md, tägliche Protokolle, Notizen, Projektdateien), die lesbar und bearbeitbar sind. Zur Laufzeit ruft der Agent nur relevante Abschnitte ab.

Vorteile

Weniger Tokenverschwendung – nicht jede dauerhafte Tatsache wird in jeden Prompt gestopft.
Sauberere Gedächtnisdateien – keine Notwendigkeit, alles in einen riesigen Kontextklumpen zu pressen.
Besseres Abrufen – findet konzeptionell verwandte Notizen, auch wenn die Formulierung nicht exakt übereinstimmt.
Einfachere Fehlersuche – die Quelle der Wahrheit ist Klartext, keine undurchsichtige Vektordatenbank.
Bessere Privatsphäre – Embeddings werden lokal berechnet, keine Daten an eine gehostete API gesendet.