Recherche de mémoire sémantique locale pour agents OpenClaw utilisant les embeddings Harrier

Un nouveau dépôt montre comment donner à un agent OpenClaw une recherche de mémoire sémantique locale sans envoyer d'embeddings à un service externe. L'approche consiste à exécuter un petit serveur d'embedding local autour du modèle Harrier de Microsoft (microsoft/harrier-oss-v1-0.6b), à exposer une API compatible avec Ollama, et à le connecter à la configuration memorySearch d'OpenClaw.
Comment ça fonctionne
Le serveur d'embedding exécute Harrier localement et fournit les endpoints /api/embed et /api/embeddings qui correspondent au format API d'Ollama. Le memorySearch d'OpenClaw prend déjà en charge les endpoints de type Ollama, donc en le pointant vers http://localhost:8000, l'agent obtient une couche de mémoire sémantique locale de pointe.
Pourquoi c'est important pour la mémoire des agents
La plupart des systèmes de mémoire des agents ont deux points faibles :
- Enfourner trop de mémoire dans le prompt brûle des tokens et rend le contexte confus.
- Garder des fichiers de mémoire petits et manuels devient difficile à maintenir à mesure que l'historique grandit.
La recherche de mémoire sémantique offre une voie intermédiaire. La mémoire à long terme reste dans des fichiers markdown normaux (MEMORY.md, journaux quotidiens, notes, fichiers de projet) lisibles et modifiables par l'humain. Lors de l'exécution, l'agent récupère uniquement les passages pertinents.
Avantages
- Moins de gaspillage de tokens — on ne fourre pas chaque fait durable dans chaque prompt.
- Fichiers de mémoire plus propres — pas besoin de compresser en un seul blob de contexte géant.
- Meilleur rappel — trouve des notes conceptuellement liées même si le libellé ne correspond pas exactement.
- Débogage plus facile — la source de vérité est en texte clair, pas une base de données vectorielles opaque.
- Meilleure confidentialité — les embeddings sont calculés localement, aucune donnée n'est envoyée à une API hébergée.
Ce que contient le dépôt
- Petit serveur d'embedding Python implémentant des endpoints compatibles avec Ollama
- Exemple de configuration
memorySearchpour OpenClaw - Modèle de service macOS launchd
- Corpus de mémoire markdown factice
- Tests de fumée et démo de requête locale
Le dépôt se trouve à l'adresse github.com/promptclickrun/harrier-openclaw-memory-search.
📖 Lire la source complète : r/openclaw
👀 See Also

Codegraph : Un graphe de connaissances pré-indexé réduit de 94 % les appels d'outils Claude/Cursor
Codegraph utilise un graphe de connaissances pré-indexé des relations entre symboles, des graphes d'appel et de la structure du code pour réduire les appels d'outils API jusqu'à 94 % et accélérer l'utilisation d'environ 77 % pour les agents Claude, Cursor, Codex et OpenCode.

Forge : Transformez un Mac ou une machine Linux en un hôte de développement toujours actif pour les agents de codage IA.
Forge est un outil open-source qui installe un démon pour transformer n'importe quelle machine Mac ou Linux en un hôte de développement permanent et toujours actif. Il maintient les agents d'IA de codage en fonctionnement lorsque vous vous éloignez, fournit un tableau de bord web pour la surveillance et utilise Tailscale pour un accès distant sécurisé via SSH.

nan-forget : Mémoire de codage IA locale dans un seul fichier SQLite
nan-forget est un outil de mémoire pour les agents d'IA de codage qui stocke le contexte dans un seul fichier SQLite (~3 Mo) sans services en arrière-plan. Il utilise un pipeline de récupération en 3 étapes et fonctionne avec Claude Code, Cursor et le terminal via CLI.

Screenbox : Desktops virtuels open source pour agents IA, entièrement créés par la voix
Screenbox fournit des bureaux Linux isolés dans Docker pour les agents d'IA, résolvant les conflits lorsque plusieurs agents fonctionnent en parallèle. Le projet a été entièrement construit en utilisant des commandes vocales avec Claude Code, et le créateur n'a pas vu une seule ligne du code.