Busca Semântica Local em Memória para Agentes OpenClaw Usando Embeddings Harrier

Um novo repositório mostra como dar a um agente OpenClaw busca de memória semântica local sem enviar embeddings para um serviço externo. A abordagem executa um pequeno servidor de embeddings local com o modelo Harrier da Microsoft (microsoft/harrier-oss-v1-0.6b), expõe uma API compatível com Ollama e a conecta à configuração memorySearch do OpenClaw.
Como funciona
O servidor de embeddings executa o Harrier localmente e fornece endpoints /api/embed e /api/embeddings que seguem o formato da API do Ollama. O memorySearch do OpenClaw já suporta endpoints no estilo Ollama, então apontá-lo para http://localhost:8000 dá ao agente uma camada de memória semântica local de última geração.
Por que isso importa para a memória do agente
A maioria dos sistemas de memória de agente tem dois pontos problemáticos:
- Colocar muita memória no prompt queima tokens e bagunça o contexto.
- Manter arquivos de memória pequenos e manuais se torna difícil de manter à medida que o histórico cresce.
A busca de memória semântica oferece um meio-termo. A memória de longo prazo permanece em arquivos markdown normais (MEMORY.md, logs diários, notas, arquivos de projeto) que são legíveis e editáveis por humanos. Em tempo de execução, o agente recupera apenas os trechos relevantes.
Benefícios
- Menos desperdício de tokens — não é necessário colocar todo fato durável em cada prompt.
- Arquivos de memória mais limpos — não há necessidade de comprimir em um grande bloco de contexto.
- Melhor recuperação — encontra notas conceitualmente relacionadas mesmo quando a redação não corresponde exatamente.
- Depuração mais fácil — a fonte da verdade é texto simples, não um banco de dados vetorial opaco.
- Melhor privacidade — embeddings calculados localmente, sem envio de dados para API hospedada.
O que o repositório inclui
- Pequeno servidor de embeddings em Python implementando endpoints compatíveis com Ollama
- Exemplo de configuração
memorySearchdo OpenClaw - Modelo de serviço launchd para macOS
- Corpus de memória markdown simulado
- Testes básicos e demonstração de consulta local
O repositório está em github.com/promptclickrun/harrier-openclaw-memory-search.
📖 Read the full source: r/openclaw
👀 See Also

Agente AFK do Claude Code: Execute Trabalhadores Autônomos com Suporte do Discord via Plugin do Teams
Use o plugin de canais oficial e o agente de equipes com a variável de ambiente CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 para iniciar trabalhadores individuais a partir do Discord. Inclui um CLAUDE.md completo para um agente líder que despacha, nunca trabalha e força o desligamento de trabalhadores silenciosos após 60 minutos.

js-notepad: Um Bloco de Notas Programável com Servidor MCP Integrado para Claude Code
js-notepad é um aplicativo de bloco de notas programável gratuito e de código aberto, construído com assistência do Claude Code. Ele possui um servidor MCP integrado, permitindo que o Claude Code interaja diretamente com o aplicativo para ler/escrever páginas, executar scripts, criar tarefas e enviar resultados.

MatchKit: Gerador de Sistema de Design para Projetos de Código Claude
MatchKit é uma ferramenta que gera sistemas de design completos e personalizados para projetos desenvolvidos com Claude Code. Ela extrai as cores da marca de logos enviados e gera componentes, layouts e tokens de design personalizáveis para evitar a aparência genérica comum em ferramentas de codificação por IA.

Mestre de Prompt: Habilidade Claude para Gerar Prompts Precisos de Ferramentas de IA
Prompt-Master é uma habilidade gratuita do Claude que cria prompts precisos para várias ferramentas de IA, incluindo Cursor, Claude Code, GPT, Midjourney, Kling e Eleven Labs. A ferramenta alcançou mais de 600 estrelas no GitHub e processa mais de 4000 acessos.