RAG Híbrido para Memória de Agente Local com OpenClaw, Ollama e nomic-embed-text

Problema: Recuperação, Não Armazenamento
O desenvolvedor tinha meses de registros de memória diários armazenados em arquivos markdown, o que funcionava para salvar informações, mas não para encontrá-las novamente. Quando o agente precisava de contexto passado, ele voltava a executar ls, abrindo arquivos um por um, gastando tokens e às vezes perdendo informações relevantes. O problema era a recuperação por significado, não o armazenamento.
Solução: RAG Híbrido com Embeddings Locais
O desenvolvedor habilitou memorySearch no OpenClaw usando Ollama como provedor e nomic-embed-text para embeddings locais, rodando em modo híbrido. Híbrido significa 70% de similaridade vetorial (cosseno via nomic-embed-text) combinado com 30% de correspondência de palavras-chave BM25. O vetor lida com proximidade semântica enquanto o BM25 lida com nomes exatos, versões e IDs. O MMR reduz resultados redundantes, e o decaimento temporal dá mais peso aos registros recentes. Tudo roda localmente sem APIs externas.
Configuração
"memorySearch": {
"provider": "ollama",
"query": {
"hybrid": {
"enabled": true,
"vectorWeight": 0.7,
"textWeight": 0.3,
"mmr": {
"enabled": true,
"lambda": 0.7
},
"temporalDecay": {
"enabled": true,
"halfLifeDays": 30
}
}
}
}Instruções de Configuração
- OpenClaw detecta Ollama automaticamente em localhost:11434
- Não é necessário especificar baseUrl ou modelo - ele pega nomic-embed-text se baixado
- Execute
ollama pull nomic-embed-textprimeiro, depois reinicie o gateway - Evite definir
provider: "openai"e apontar baseUrl para Ollama - useprovider: "ollama"diretamente
Mudança Comportamental Necessária
Habilitar a ferramenta não foi suficiente. Sem instruções explícitas para usar memorySearch antes de ler arquivos diretamente, o agente pulava isso e tomava a rota mais lenta e pesada em tokens. O desenvolvedor escreveu uma regra tanto no AGENTS.md quanto no MEMORY.md no workspace para tornar a busca de memória parte do fluxo de trabalho normal do agente.
Resultados Antes vs Depois
- Antes: Navegar pastas, abrir arquivos às cegas, torcer para a redação corresponder, desperdiçar tokens, perder contexto
- Depois: Executar
memory_searchcom consulta semântica, recuperar resultados classificados com pontuações de similaridade, abrir a melhor correspondência, responder a partir de notas passadas reais - Pontuações de similaridade para resultados relevantes normalmente variam de 0,45 a 0,48 para nomic-embed-text em registros de prosa
Notas Práticas
- nomic-embed-text tem um limite de contexto de 2048 tokens por padrão, não 8192 - arquivos grandes podem ser truncados na indexação
- Arquivos de memória em espanhol funcionam bem - nomic-embed-text lida com espanhol sem problemas
- A qualidade da recuperação depende da qualidade das notas - registros vagos ainda causam dificuldades na busca semântica
Stack Tecnológico
- OpenClaw (local, auto-hospedado)
- Ollama + nomic-embed-text:latest
- SQLite com sqlite-vec e FTS5 (criado automaticamente pelo OpenClaw no primeiro uso)
- Mac mini M4, 16GB de memória unificada
📖 Leia a fonte completa: r/openclaw
👀 See Also

Usando a Versão Gratuita do Claude para Atualizar Automaticamente Bancos de Dados de Pesquisa no Notion
Um desenvolvedor criou um sistema usando a versão gratuita do Claude para estruturar e salvar automaticamente pesquisas em bancos de dados do Notion. O fluxo de trabalho pega notas de pesquisa brutas e as formata em entradas estruturadas de banco de dados com campos, categorias e resumos consistentes.

Usando Open Claw para Transcrever Reels do Instagram via Bot do Telegram
Um usuário configurou o Open Claw com uma chave de API da Groq para transcrever links de reels do Instagram colados em um chat do Telegram, evitando uma assinatura de US$ 20/mês do TurboScribe.

Análise do Antropomorfismo no Claude Pokemon Chat Usando Modelos Bayesianos
Um pesquisador analisou mensagens do chat do Twitch do benchmark Pokémon do Claude para estudar como os usuários antropomorfizam a IA, usando modelos bayesianos de efeitos mistos em 107 mil mensagens anotadas pelo Gemini 2.0 Flash. Marcadores de falsa crença foram fortes preditores de antropomorfização, aumentando a probabilidade de ~11% para ~45%.

Usando Opus 4.6 e GPT 5.4 para revisar por pares um design de pilha de memória para OpenClaw
Um desenvolvedor usou o Claude Opus 4.6 para projetar uma pilha de memória de três camadas para o OpenClaw e, em seguida, pediu ao GPT 5.4 para revisar o projeto. A pilha inclui o Lossless Claw para preservação de mensagens, busca híbrida SQLite para correspondência de palavras-chave e Mem0 Cloud para persistência entre sessões.