Lokale semantische Speichersuche für OpenClaw-Agenten mittels Harrier-Embeddings

✍️ OpenClawRadar📅 Veröffentlicht: 7. Juni 2026🔗 Source
Lokale semantische Speichersuche für OpenClaw-Agenten mittels Harrier-Embeddings
Ad

Ein neues Repository zeigt, wie man einem OpenClaw-Agenten eine lokale semantische Gedächtnissuche ohne das Senden von Embeddings an einen externen Dienst ermöglicht. Der Ansatz betreibt einen kleinen lokalen Embedding-Server auf Basis von Microsofts Harrier-Modell (microsoft/harrier-oss-v1-0.6b), stellt eine Ollama-kompatible API bereit und verbindet diese mit OpenClaws memorySearch-Konfiguration.

Wie es funktioniert

Der Embedding-Server führt Harrier lokal aus und bietet die Endpunkte /api/embed und /api/embeddings an, die dem API-Format von Ollama entsprechen. OpenClaws memorySearch unterstützt bereits Ollama-ähnliche Endpunkte, daher genügt es, auf http://localhost:8000 zu verweisen, um dem Agenten eine lokale, hochmoderne semantische Gedächtnisschicht zu geben.

Warum dies für das Agentengedächtnis wichtig ist

Die meisten Agent-Gedächtnissysteme haben zwei Schwachstellen:

  • Zu viel Gedächtnis in den Prompt zu stopfen, verbrennt Tokens und macht den Kontext unübersichtlich.
  • Gedächtnisdateien klein und manuell zu halten, wird mit wachsender Historie schwer wartbar.

Die semantische Gedächtnissuche bietet einen Mittelweg. Das Langzeitgedächtnis bleibt in normalen Markdown-Dateien (MEMORY.md, tägliche Protokolle, Notizen, Projektdateien), die lesbar und bearbeitbar sind. Zur Laufzeit ruft der Agent nur relevante Abschnitte ab.

Ad

Vorteile

  • Weniger Tokenverschwendung – nicht jede dauerhafte Tatsache wird in jeden Prompt gestopft.
  • Sauberere Gedächtnisdateien – keine Notwendigkeit, alles in einen riesigen Kontextklumpen zu pressen.
  • Besseres Abrufen – findet konzeptionell verwandte Notizen, auch wenn die Formulierung nicht exakt übereinstimmt.
  • Einfachere Fehlersuche – die Quelle der Wahrheit ist Klartext, keine undurchsichtige Vektordatenbank.
  • Bessere Privatsphäre – Embeddings werden lokal berechnet, keine Daten an eine gehostete API gesendet.

Was das Repository enthält

  • Kleiner Python-Embedding-Server mit Ollama-kompatiblen Endpunkten
  • Beispielkonfiguration für OpenClaw memorySearch
  • macOS launchd-Dienstvorlage
  • Mock-Markdown-Gedächtniskorpus
  • Smoke-Tests und lokale Abfragedemo

Das Repository befindet sich unter github.com/promptclickrun/harrier-openclaw-memory-search.

📖 Lesen Sie die vollständige Quelle: r/openclaw

Ad

👀 Siehe auch

Prompt für den deutschen Bürokratie-Assistenten Claude: Strukturierte juristische Korrespondenz
Werkzeuge

Prompt für den deutschen Bürokratie-Assistenten Claude: Strukturierte juristische Korrespondenz

Ein detaillierter Systemprompt für Claude, der die KI in einen strukturierten Assistenten für deutsche Bürokratie, Verträge, Versicherungsstreitigkeiten und offizielle Schreiben verwandelt, mit strengen Faktenchecks und DIN-5008-Formatierung.

OpenClawRadar
Hardware-Widget und Chrome-Erweiterung überwachen Claude-API-Ratenlimits
Werkzeuge

Hardware-Widget und Chrome-Erweiterung überwachen Claude-API-Ratenlimits

Ein Entwickler hat ein Hardware-Widget mit ESP8266 und OLED-Display gebaut, das Claudes Rate-Limits in Echtzeit verfolgt, plus eine Chrome-Erweiterung, die Claudes interne /usage-API abfängt und Nutzungsmuster anzeigt. Die Gesamtkosten für die Bauteile betragen etwa 6,50 US-Dollar.

OpenClawRadar
DeepMind DiscoRL Meta-Learning-Update-Regel von JAX zu PyTorch portiert
Werkzeuge

DeepMind DiscoRL Meta-Learning-Update-Regel von JAX zu PyTorch portiert

Ein Entwickler hat DeepMinds DiscoRL-Metalern-Update-Regel aus dem Nature-Artikel von 2025 von JAX zu PyTorch portiert. Die Implementierung umfasst ein GitHub-Repository mit einem Colab-Notebook, einer API und auf Hugging Face gehosteten Gewichten.

OpenClawRadar
OpenHelm: Eine macOS-App zur Automatisierung von Claude-Code-Aufgaben
Werkzeuge

OpenHelm: Eine macOS-App zur Automatisierung von Claude-Code-Aufgaben

OpenHelm ist eine kostenlose, lokale macOS-Anwendung, die repetitive Claude-Coding-Aufgaben automatisiert, indem sie Jobs nach Zeitplan ausführt, Fehler automatisch wiederholt und Arbeit in Teile aufteilt, um Sitzungslimits zu vermeiden. Sie nutzt Ihr bestehendes Claude-Abonnement für LLM-Aufrufe.

OpenClawRadar