RAG Híbrido para Memoria de Agente Local con OpenClaw, Ollama y nomic-embed-text

✍️ OpenClawRadar📅 Publicado: 10 de marzo de 2026🔗 Source
RAG Híbrido para Memoria de Agente Local con OpenClaw, Ollama y nomic-embed-text
Ad

Problema: Recuperación, no almacenamiento

El desarrollador tenía meses de registros de memoria diarios almacenados en archivos markdown, lo que funcionaba para guardar información pero no para encontrarla nuevamente. Cuando el agente necesitaba contexto pasado, recurría a ejecutar ls, abriendo archivos uno por uno, gastando tokens y a veces perdiendo información relevante. El problema era la recuperación por significado, no el almacenamiento.

Solución: RAG híbrido con incrustaciones locales

El desarrollador habilitó memorySearch en OpenClaw usando Ollama como proveedor y nomic-embed-text para incrustaciones locales, ejecutándose en modo híbrido. Híbrido significa 70% de similitud vectorial (coseno mediante nomic-embed-text) combinado con 30% de coincidencia de palabras clave BM25. Los vectores manejan proximidad semántica mientras que BM25 maneja nombres exactos, versiones e IDs. MMR reduce resultados redundantes y el decaimiento temporal da más peso a los registros recientes. Todo se ejecuta localmente sin APIs externas.

Configuración

"memorySearch": {
  "provider": "ollama",
  "query": {
    "hybrid": {
      "enabled": true,
      "vectorWeight": 0.7,
      "textWeight": 0.3,
      "mmr": {
        "enabled": true,
        "lambda": 0.7
      },
      "temporalDecay": {
        "enabled": true,
        "halfLifeDays": 30
      }
    }
  }
}

Instrucciones de configuración

  • OpenClaw detecta Ollama automáticamente en localhost:11434
  • No es necesario especificar baseUrl o modelo - detecta nomic-embed-text si se descargó
  • Ejecuta ollama pull nomic-embed-text primero, luego reinicia el gateway
  • Evita configurar provider: "openai" y apuntar baseUrl a Ollama - usa provider: "ollama" directamente
Ad

Cambio de comportamiento requerido

Habilitar la herramienta no fue suficiente. Sin instrucciones explícitas para usar memorySearch antes de leer archivos directamente, el agente lo omitiría y tomaría la ruta más lenta y costosa en tokens. El desarrollador escribió una regla tanto en AGENTS.md como en MEMORY.md en el espacio de trabajo para hacer que la búsqueda de memoria sea parte del flujo de trabajo normal del agente.

Resultados antes vs después

  • Antes: Navegar carpetas, abrir archivos ciegamente, esperar que coincida la redacción, desperdiciar tokens, perder contexto
  • Después: Ejecutar memory_search con consulta semántica, recuperar resultados clasificados con puntuaciones de similitud, abrir la mejor coincidencia, responder desde notas pasadas reales
  • Las puntuaciones de similitud para resultados relevantes típicamente oscilan entre 0.45 y 0.48 para nomic-embed-text en registros en prosa

Notas prácticas

  • nomic-embed-text tiene un límite de contexto de 2048 tokens por defecto, no 8192 - archivos grandes pueden truncarse al indexar
  • Los archivos de memoria en español funcionan bien - nomic-embed-text maneja español sin problemas
  • La calidad de recuperación depende de la calidad de las notas - registros vagos aún causan dificultades en búsqueda semántica

Stack tecnológico

  • OpenClaw (local, autoalojado)
  • Ollama + nomic-embed-text:latest
  • SQLite con sqlite-vec y FTS5 (creado automáticamente por OpenClaw en el primer uso)
  • Mac mini M4, 16GB de memoria unificada

📖 Leer la fuente completa: r/openclaw

Ad

👀 Ver también

Casos Prácticos de Uso de OpenClaw de la Comunidad
Casos de uso

Casos Prácticos de Uso de OpenClaw de la Comunidad

Desarrolladores y equipos están utilizando OpenClaw para prospección en frío, automatización de contenido SEO, gestión de redes sociales, consultas de datos de clientes, pruebas de sitios web, monitoreo de servidores, procesamiento de recibos, negociaciones de compra de autos, creación de capítulos de podcasts y planificación de objetivos diarios.

OpenClawRadar
Usando Claude, Gemini y GPT para tareas de programación asistida por IA.
Casos de uso

Usando Claude, Gemini y GPT para tareas de programación asistida por IA.

Descubre cómo combinar Claude, Gemini y GPT puede mejorar los flujos de trabajo de codificación de IA aprovechando sus capacidades únicas de acceso para tareas específicas.

OpenClawRadar
Usuario de Reddit ejecuta 25+ agentes de IA programados como personas personales en Mac: ¿Esto es útil o solo complejidad?
Casos de uso

Usuario de Reddit ejecuta 25+ agentes de IA programados como personas personales en Mac: ¿Esto es útil o solo complejidad?

Un desarrollador comparte su configuración personal de IA con más de 25 agentes programados en un Mac, organizados en cuatro personajes (Esposa, Hija, Hijo y un monitor) que automatizan trabajo, proyectos de código abierto, pasatiempos y PR de GitHub — y pregunta a la comunidad si es genuinamente útil o complejidad por la complejidad misma.

OpenClawRadar
SDR utiliza videos generados por IA para reenganchar a prospectos D2C fríos.
Casos de uso

SDR utiliza videos generados por IA para reenganchar a prospectos D2C fríos.

Un SDR (Representante de Desarrollo de Ventas) en una empresa de SaaS que vende a marcas D2C (Directo al Consumidor) ha compartido un experimento práctico sobre el uso de videos generados por IA para la prospección de ventas. El problema central abordado es la bandeja de entrada saturada de los fundadores de D2C, quienes reciben numerosas propuestas similares basadas en texto cada semana.

OpenClawRadar