Recherche mémoire sémantique locale : Harrier + OpenClaw

Un nouveau dépôt montre comment donner à un agent OpenClaw une recherche de mémoire sémantique locale sans envoyer d'embeddings à un service externe. L'approche consiste à exécuter un petit serveur d'embedding local autour du modèle Harrier de Microsoft (microsoft/harrier-oss-v1-0.6b), à exposer une API compatible avec Ollama, et à le connecter à la configuration memorySearch d'OpenClaw.

Comment ça fonctionne

Le serveur d'embedding exécute Harrier localement et fournit les endpoints /api/embed et /api/embeddings qui correspondent au format API d'Ollama. Le memorySearch d'OpenClaw prend déjà en charge les endpoints de type Ollama, donc en le pointant vers http://localhost:8000, l'agent obtient une couche de mémoire sémantique locale de pointe.

Pourquoi c'est important pour la mémoire des agents

La plupart des systèmes de mémoire des agents ont deux points faibles :

Enfourner trop de mémoire dans le prompt brûle des tokens et rend le contexte confus.
Garder des fichiers de mémoire petits et manuels devient difficile à maintenir à mesure que l'historique grandit.

La recherche de mémoire sémantique offre une voie intermédiaire. La mémoire à long terme reste dans des fichiers markdown normaux (MEMORY.md, journaux quotidiens, notes, fichiers de projet) lisibles et modifiables par l'humain. Lors de l'exécution, l'agent récupère uniquement les passages pertinents.

Avantages

Moins de gaspillage de tokens — on ne fourre pas chaque fait durable dans chaque prompt.
Fichiers de mémoire plus propres — pas besoin de compresser en un seul blob de contexte géant.
Meilleur rappel — trouve des notes conceptuellement liées même si le libellé ne correspond pas exactement.
Débogage plus facile — la source de vérité est en texte clair, pas une base de données vectorielles opaque.
Meilleure confidentialité — les embeddings sont calculés localement, aucune donnée n'est envoyée à une API hébergée.

Ce que contient le dépôt

Petit serveur d'embedding Python implémentant des endpoints compatibles avec Ollama
Exemple de configuration memorySearch pour OpenClaw
Modèle de service macOS launchd
Corpus de mémoire markdown factice
Tests de fumée et démo de requête locale

Le dépôt se trouve à l'adresse github.com/promptclickrun/harrier-openclaw-memory-search.

📖 Lire la source complète : r/openclaw

Recherche de mémoire sémantique locale pour agents OpenClaw utilisant les embeddings Harrier

Comment ça fonctionne

Pourquoi c'est important pour la mémoire des agents

Avantages

Ce que contient le dépôt

👀 See Also

Codegraph : Un graphe de connaissances pré-indexé réduit de 94 % les appels d'outils Claude/Cursor

Forge : Transformez un Mac ou une machine Linux en un hôte de développement toujours actif pour les agents de codage IA.

nan-forget : Mémoire de codage IA locale dans un seul fichier SQLite

Screenbox : Desktops virtuels open source pour agents IA, entièrement créés par la voix