Lokale semantische Speichersuche für OpenClaw-Agenten mittels Harrier-Embeddings

Ein neues Repository zeigt, wie man einem OpenClaw-Agenten eine lokale semantische Gedächtnissuche ohne das Senden von Embeddings an einen externen Dienst ermöglicht. Der Ansatz betreibt einen kleinen lokalen Embedding-Server auf Basis von Microsofts Harrier-Modell (microsoft/harrier-oss-v1-0.6b), stellt eine Ollama-kompatible API bereit und verbindet diese mit OpenClaws memorySearch-Konfiguration.
Wie es funktioniert
Der Embedding-Server führt Harrier lokal aus und bietet die Endpunkte /api/embed und /api/embeddings an, die dem API-Format von Ollama entsprechen. OpenClaws memorySearch unterstützt bereits Ollama-ähnliche Endpunkte, daher genügt es, auf http://localhost:8000 zu verweisen, um dem Agenten eine lokale, hochmoderne semantische Gedächtnisschicht zu geben.
Warum dies für das Agentengedächtnis wichtig ist
Die meisten Agent-Gedächtnissysteme haben zwei Schwachstellen:
- Zu viel Gedächtnis in den Prompt zu stopfen, verbrennt Tokens und macht den Kontext unübersichtlich.
- Gedächtnisdateien klein und manuell zu halten, wird mit wachsender Historie schwer wartbar.
Die semantische Gedächtnissuche bietet einen Mittelweg. Das Langzeitgedächtnis bleibt in normalen Markdown-Dateien (MEMORY.md, tägliche Protokolle, Notizen, Projektdateien), die lesbar und bearbeitbar sind. Zur Laufzeit ruft der Agent nur relevante Abschnitte ab.
Vorteile
- Weniger Tokenverschwendung – nicht jede dauerhafte Tatsache wird in jeden Prompt gestopft.
- Sauberere Gedächtnisdateien – keine Notwendigkeit, alles in einen riesigen Kontextklumpen zu pressen.
- Besseres Abrufen – findet konzeptionell verwandte Notizen, auch wenn die Formulierung nicht exakt übereinstimmt.
- Einfachere Fehlersuche – die Quelle der Wahrheit ist Klartext, keine undurchsichtige Vektordatenbank.
- Bessere Privatsphäre – Embeddings werden lokal berechnet, keine Daten an eine gehostete API gesendet.
Was das Repository enthält
- Kleiner Python-Embedding-Server mit Ollama-kompatiblen Endpunkten
- Beispielkonfiguration für OpenClaw
memorySearch - macOS launchd-Dienstvorlage
- Mock-Markdown-Gedächtniskorpus
- Smoke-Tests und lokale Abfragedemo
Das Repository befindet sich unter github.com/promptclickrun/harrier-openclaw-memory-search.
📖 Lesen Sie die vollständige Quelle: r/openclaw
👀 Siehe auch

Prompt für den deutschen Bürokratie-Assistenten Claude: Strukturierte juristische Korrespondenz
Ein detaillierter Systemprompt für Claude, der die KI in einen strukturierten Assistenten für deutsche Bürokratie, Verträge, Versicherungsstreitigkeiten und offizielle Schreiben verwandelt, mit strengen Faktenchecks und DIN-5008-Formatierung.

Hardware-Widget und Chrome-Erweiterung überwachen Claude-API-Ratenlimits
Ein Entwickler hat ein Hardware-Widget mit ESP8266 und OLED-Display gebaut, das Claudes Rate-Limits in Echtzeit verfolgt, plus eine Chrome-Erweiterung, die Claudes interne /usage-API abfängt und Nutzungsmuster anzeigt. Die Gesamtkosten für die Bauteile betragen etwa 6,50 US-Dollar.

DeepMind DiscoRL Meta-Learning-Update-Regel von JAX zu PyTorch portiert
Ein Entwickler hat DeepMinds DiscoRL-Metalern-Update-Regel aus dem Nature-Artikel von 2025 von JAX zu PyTorch portiert. Die Implementierung umfasst ein GitHub-Repository mit einem Colab-Notebook, einer API und auf Hugging Face gehosteten Gewichten.

OpenHelm: Eine macOS-App zur Automatisierung von Claude-Code-Aufgaben
OpenHelm ist eine kostenlose, lokale macOS-Anwendung, die repetitive Claude-Coding-Aufgaben automatisiert, indem sie Jobs nach Zeitplan ausführt, Fehler automatisch wiederholt und Arbeit in Teile aufteilt, um Sitzungslimits zu vermeiden. Sie nutzt Ihr bestehendes Claude-Abonnement für LLM-Aufrufe.