RAG Hybride Local avec OpenClaw, Ollama et nomic-embed-text

Problème : Récupération, pas stockage

Le développeur avait des mois de journaux de mémoire quotidiens stockés dans des fichiers markdown, ce qui fonctionnait pour sauvegarder les informations mais pas pour les retrouver. Lorsque l'agent avait besoin d'un contexte passé, il revenait à exécuter ls, ouvrait les fichiers un par un, dépensait des tokens et parfois manquait des informations pertinentes. Le problème était la récupération par signification, pas le stockage.

Solution : RAG hybride avec plongements locaux

Le développeur a activé memorySearch dans OpenClaw en utilisant Ollama comme fournisseur et nomic-embed-text pour les plongements locaux, fonctionnant en mode hybride. Hybride signifie 70% de similarité vectorielle (cosinus via nomic-embed-text) combinée à 30% de correspondance par mots-clés BM25. Les vecteurs gèrent la proximité sémantique tandis que BM25 gère les noms exacts, les versions et les identifiants. MMR réduit les résultats redondants, et la décroissance temporelle donne plus de poids aux journaux récents. Tout fonctionne localement sans API externes.

Configuration

"memorySearch": {
  "provider": "ollama",
  "query": {
    "hybrid": {
      "enabled": true,
      "vectorWeight": 0.7,
      "textWeight": 0.3,
      "mmr": {
        "enabled": true,
        "lambda": 0.7
      },
      "temporalDecay": {
        "enabled": true,
        "halfLifeDays": 30
      }
    }
  }
}

Instructions d'installation

OpenClaw détecte Ollama automatiquement à localhost:11434
Pas besoin de spécifier baseUrl ou modèle - il récupère nomic-embed-text s'il est téléchargé
Exécutez ollama pull nomic-embed-text d'abord, puis redémarrez la passerelle
Évitez de définir provider: "openai" et de pointer baseUrl vers Ollama - utilisez provider: "ollama" directement

Changement comportemental requis

Activer l'outil n'était pas suffisant. Sans instructions explicites pour utiliser memorySearch avant de lire les fichiers directement, l'agent le sautait et prenait la voie plus lente et consommatrice de tokens. Le développeur a écrit une règle dans AGENTS.md et MEMORY.md dans l'espace de travail pour intégrer la recherche de mémoire dans le flux de travail normal de l'agent.

Résultats avant vs après

Avant : Parcourir les dossiers, ouvrir les fichiers aveuglément, espérer que la formulation corresponde, gaspiller des tokens, manquer le contexte
Après : Exécuter memory_search avec une requête sémantique, récupérer des résultats classés avec des scores de similarité, ouvrir la meilleure correspondance, répondre à partir de notes passées réelles
Les scores de similarité pour les résultats pertinents varient généralement de 0,45 à 0,48 pour nomic-embed-text sur les journaux en prose

Notes pratiques

nomic-embed-text a une limite de contexte de 2048 tokens par défaut, pas 8192 - les gros fichiers peuvent être tronqués lors de l'indexation
Les fichiers de mémoire en espagnol fonctionnent bien - nomic-embed-text gère l'espagnol sans problème
La qualité de la récupération dépend de la qualité des notes - les journaux vagues causent toujours des difficultés à la recherche sémantique

Pile technologique

OpenClaw (local, auto-hébergé)
Ollama + nomic-embed-text:latest
SQLite avec sqlite-vec et FTS5 (créé automatiquement par OpenClaw lors de la première utilisation)
Mac mini M4, 16 Go de mémoire unifiée

📖 Lire la source complète : r/openclaw

RAG Hybride pour la Mémoire d'Agent Local avec OpenClaw, Ollama et nomic-embed-text

Problème : Récupération, pas stockage

Solution : RAG hybride avec plongements locaux

Configuration

Instructions d'installation

Changement comportemental requis

Résultats avant vs après

Notes pratiques

Pile technologique

👀 See Also

Automatiser la prospection LinkedIn avec les tâches planifiées de Claude Cowork

Exécuter Claude Code en tant que moteur de jugement pur sur l'ensemble du cycle de développement logiciel

Traduire en fr : Les règles du Road Runner de Chuck Jones comme principes de conception d'identité pour agents IA

Les équipes de l'agent Claude Code construisent des produits Micro SaaS en 4 heures grâce à un coffre Obsidian.