RAG Híbrido 70/30: OpenClaw + Ollama + nomic-embed-text

Problema: Recuperación, no almacenamiento

El desarrollador tenía meses de registros de memoria diarios almacenados en archivos markdown, lo que funcionaba para guardar información pero no para encontrarla nuevamente. Cuando el agente necesitaba contexto pasado, recurría a ejecutar ls, abriendo archivos uno por uno, gastando tokens y a veces perdiendo información relevante. El problema era la recuperación por significado, no el almacenamiento.

Solución: RAG híbrido con incrustaciones locales

El desarrollador habilitó memorySearch en OpenClaw usando Ollama como proveedor y nomic-embed-text para incrustaciones locales, ejecutándose en modo híbrido. Híbrido significa 70% de similitud vectorial (coseno mediante nomic-embed-text) combinado con 30% de coincidencia de palabras clave BM25. Los vectores manejan proximidad semántica mientras que BM25 maneja nombres exactos, versiones e IDs. MMR reduce resultados redundantes y el decaimiento temporal da más peso a los registros recientes. Todo se ejecuta localmente sin APIs externas.

Configuración

"memorySearch": {
  "provider": "ollama",
  "query": {
    "hybrid": {
      "enabled": true,
      "vectorWeight": 0.7,
      "textWeight": 0.3,
      "mmr": {
        "enabled": true,
        "lambda": 0.7
      },
      "temporalDecay": {
        "enabled": true,
        "halfLifeDays": 30
      }
    }
  }
}

Instrucciones de configuración

OpenClaw detecta Ollama automáticamente en localhost:11434
No es necesario especificar baseUrl o modelo - detecta nomic-embed-text si se descargó
Ejecuta ollama pull nomic-embed-text primero, luego reinicia el gateway
Evita configurar provider: "openai" y apuntar baseUrl a Ollama - usa provider: "ollama" directamente

Cambio de comportamiento requerido

Habilitar la herramienta no fue suficiente. Sin instrucciones explícitas para usar memorySearch antes de leer archivos directamente, el agente lo omitiría y tomaría la ruta más lenta y costosa en tokens. El desarrollador escribió una regla tanto en AGENTS.md como en MEMORY.md en el espacio de trabajo para hacer que la búsqueda de memoria sea parte del flujo de trabajo normal del agente.

Resultados antes vs después

Antes: Navegar carpetas, abrir archivos ciegamente, esperar que coincida la redacción, desperdiciar tokens, perder contexto
Después: Ejecutar memory_search con consulta semántica, recuperar resultados clasificados con puntuaciones de similitud, abrir la mejor coincidencia, responder desde notas pasadas reales
Las puntuaciones de similitud para resultados relevantes típicamente oscilan entre 0.45 y 0.48 para nomic-embed-text en registros en prosa

Notas prácticas

nomic-embed-text tiene un límite de contexto de 2048 tokens por defecto, no 8192 - archivos grandes pueden truncarse al indexar
Los archivos de memoria en español funcionan bien - nomic-embed-text maneja español sin problemas
La calidad de recuperación depende de la calidad de las notas - registros vagos aún causan dificultades en búsqueda semántica

Stack tecnológico

OpenClaw (local, autoalojado)
Ollama + nomic-embed-text:latest
SQLite con sqlite-vec y FTS5 (creado automáticamente por OpenClaw en el primer uso)
Mac mini M4, 16GB de memoria unificada

📖 Leer la fuente completa: r/openclaw

RAG Híbrido para Memoria de Agente Local con OpenClaw, Ollama y nomic-embed-text

Problema: Recuperación, no almacenamiento

Solución: RAG híbrido con incrustaciones locales

Configuración

Instrucciones de configuración

Cambio de comportamiento requerido

Resultados antes vs después

Notas prácticas

Stack tecnológico

👀 Ver también

Ejecutando un Equipo de Inicio Multiagente en OpenClaw: Configuración y Patrones

Desarrollador Crea Producto SaaS Completo con Claude Cowork: Aplicación de Marcador de MLB con Autenticación, Pagos y Widget Integrable

Solución de Continuidad de Memoria del Agente OpenClaw Utilizando Sistema de Consulta de Base de Datos

Diseñador de Producto Lanza Aplicación de Grabación de Pantalla para macOS Usando Claude Code