RAG Hybride pour la Mémoire d'Agent Local avec OpenClaw, Ollama et nomic-embed-text

✍️ OpenClawRadar📅 Publié: March 10, 2026🔗 Source
RAG Hybride pour la Mémoire d'Agent Local avec OpenClaw, Ollama et nomic-embed-text
Ad

Problème : Récupération, pas stockage

Le développeur avait des mois de journaux de mémoire quotidiens stockés dans des fichiers markdown, ce qui fonctionnait pour sauvegarder les informations mais pas pour les retrouver. Lorsque l'agent avait besoin d'un contexte passé, il revenait à exécuter ls, ouvrait les fichiers un par un, dépensait des tokens et parfois manquait des informations pertinentes. Le problème était la récupération par signification, pas le stockage.

Solution : RAG hybride avec plongements locaux

Le développeur a activé memorySearch dans OpenClaw en utilisant Ollama comme fournisseur et nomic-embed-text pour les plongements locaux, fonctionnant en mode hybride. Hybride signifie 70% de similarité vectorielle (cosinus via nomic-embed-text) combinée à 30% de correspondance par mots-clés BM25. Les vecteurs gèrent la proximité sémantique tandis que BM25 gère les noms exacts, les versions et les identifiants. MMR réduit les résultats redondants, et la décroissance temporelle donne plus de poids aux journaux récents. Tout fonctionne localement sans API externes.

Configuration

"memorySearch": {
  "provider": "ollama",
  "query": {
    "hybrid": {
      "enabled": true,
      "vectorWeight": 0.7,
      "textWeight": 0.3,
      "mmr": {
        "enabled": true,
        "lambda": 0.7
      },
      "temporalDecay": {
        "enabled": true,
        "halfLifeDays": 30
      }
    }
  }
}

Instructions d'installation

  • OpenClaw détecte Ollama automatiquement à localhost:11434
  • Pas besoin de spécifier baseUrl ou modèle - il récupère nomic-embed-text s'il est téléchargé
  • Exécutez ollama pull nomic-embed-text d'abord, puis redémarrez la passerelle
  • Évitez de définir provider: "openai" et de pointer baseUrl vers Ollama - utilisez provider: "ollama" directement
Ad

Changement comportemental requis

Activer l'outil n'était pas suffisant. Sans instructions explicites pour utiliser memorySearch avant de lire les fichiers directement, l'agent le sautait et prenait la voie plus lente et consommatrice de tokens. Le développeur a écrit une règle dans AGENTS.md et MEMORY.md dans l'espace de travail pour intégrer la recherche de mémoire dans le flux de travail normal de l'agent.

Résultats avant vs après

  • Avant : Parcourir les dossiers, ouvrir les fichiers aveuglément, espérer que la formulation corresponde, gaspiller des tokens, manquer le contexte
  • Après : Exécuter memory_search avec une requête sémantique, récupérer des résultats classés avec des scores de similarité, ouvrir la meilleure correspondance, répondre à partir de notes passées réelles
  • Les scores de similarité pour les résultats pertinents varient généralement de 0,45 à 0,48 pour nomic-embed-text sur les journaux en prose

Notes pratiques

  • nomic-embed-text a une limite de contexte de 2048 tokens par défaut, pas 8192 - les gros fichiers peuvent être tronqués lors de l'indexation
  • Les fichiers de mémoire en espagnol fonctionnent bien - nomic-embed-text gère l'espagnol sans problème
  • La qualité de la récupération dépend de la qualité des notes - les journaux vagues causent toujours des difficultés à la recherche sémantique

Pile technologique

  • OpenClaw (local, auto-hébergé)
  • Ollama + nomic-embed-text:latest
  • SQLite avec sqlite-vec et FTS5 (créé automatiquement par OpenClaw lors de la première utilisation)
  • Mac mini M4, 16 Go de mémoire unifiée

📖 Lire la source complète : r/openclaw

Ad

👀 See Also

Automatiser la prospection LinkedIn avec les tâches planifiées de Claude Cowork
Use Cases

Automatiser la prospection LinkedIn avec les tâches planifiées de Claude Cowork

Un développeur a créé une tâche planifiée Claude Cowork qui envoie automatiquement 10 messages LinkedIn personnalisés quotidiennement en accédant à LinkedIn Sales Navigator, en lisant les profils, en vérifiant les publications récentes et en rédigeant des messages de prospection sur mesure.

OpenClawRadar
Exécuter Claude Code en tant que moteur de jugement pur sur l'ensemble du cycle de développement logiciel
Use Cases

Exécuter Claude Code en tant que moteur de jugement pur sur l'ensemble du cycle de développement logiciel

Un développeur partage son architecture utilisant Claude Code comme moteur de raisonnement dans un système multicouche : Python gère l'orchestration, Claude Code s'occupe de l'écriture et de la révision du code, avec des sous-agents isolés et une couche wiki persistante.

OpenClawRadar
Traduire en fr : Les règles du Road Runner de Chuck Jones comme principes de conception d'identité pour agents IA
Use Cases

Traduire en fr : Les règles du Road Runner de Chuck Jones comme principes de conception d'identité pour agents IA

Une publication Reddit analyse comment les neuf règles de Chuck Jones pour les dessins animés de Bip Bip s'appliquent à la conception de l'identité des agents IA, en mettant en lumière la Règle 2 sur les modes de défaillance internes, la Règle 3 sur l'évitement des boucles d'optimisation et la Règle 9 sur l'échec gracieux.

OpenClawRadar
Les équipes de l'agent Claude Code construisent des produits Micro SaaS en 4 heures grâce à un coffre Obsidian.
Use Cases

Les équipes de l'agent Claude Code construisent des produits Micro SaaS en 4 heures grâce à un coffre Obsidian.

Un développeur a créé un système de bout en bout où des équipes d'agents Claude Code gèrent le cycle de vie complet d'un SaaS, de la découverte d'idées au déploiement, en 4 heures. Le système utilise un coffre Obsidian comme mémoire persistante et des équipes d'agents spécialisés pour la recherche, la validation, le développement et la distribution.

OpenClawRadar