Sistema de memória de código aberto para agentes LLM alcança altas pontuações em benchmarks

Sistema de memória para agentes LLM com benchmarks publicados
Um desenvolvedor criou um sistema de memória persistente para Claude Code e OpenClaw que dá aos agentes LLM uma verdadeira continuidade de contexto entre sessões. O sistema alcança pontuações de benchmark de 90,8% no LoCoMo (superando todos os sistemas publicados) e 89,1% no LongMemEval.
Arquitetura e compatibilidade com frameworks
A arquitetura é baseada em adaptadores, atualmente conectando-se a eventos do ciclo de vida, mas os componentes principais (armazenamento, recuperação, inteligência) são independentes de framework. O pipeline de recuperação usa uma abordagem RRF de 4 canais com FTS5, Qdrant KNN, recência e caminhamento em grafo. A camada de inteligência inclui classificação de intenção, padrões de experiência e componentes de política RL que podem ser integrados a qualquer framework de agentes.
Configuração e stack tecnológico
A configuração rápida requer:
ollama pull snowflake-arctic-embed2
bun install && bun run build && bun run setup
node dist/angel/index.cjsA stack tecnológica inclui TypeScript, SQLite (better-sqlite3), Qdrant, Ollama, esbuild e Vitest.
Principais decisões de design
- Sistema de gravação dupla com SQLite como fonte de verdade e Qdrant para aceleração, com degradação graciosa
- Toda operação é não-lançadora — falhas individuais nunca quebram o pipeline
- Ganchos efêmeros (vida útil de milissegundos) para captura, Angel persistente para reflexão
- Modelos de política RL são TypeScript puro (matemática Float32Array, sem PyTorch)
- Preenchimento de embeddings com consciência de comprimento de conteúdo em segundo plano
O projeto contém 29K linhas de código, 1.968 testes e está licenciado sob MIT em https://github.com/grigorijejakisic/Claudex.
📖 Read the full source: r/openclaw
👀 See Also

Vibeyard: Painel de Código Aberto que Inicia Sessões Claude a partir de PRs, Issues e Cartões Kanban
Vibeyard é uma tela inicial open-source (MIT) com widgets arrastáveis para PRs, issues, kanban e sessões Claude. Clique em qualquer cartão para gerar uma sessão Claude Code pré-especificada para revisão, planejamento de correção ou retomada.

ddash: Ferramenta de Diagrama Mermaid com Armazenamento Baseado em URL e Integração de Código Claude
ddash é uma ferramenta gratuita de diagramas Mermaid onde todo o diagrama é comprimido no hash da URL, não exigindo backend, contas ou armazenamento. Inclui uma habilidade Claude Code que permite gerar e abrir diagramas diretamente durante conversas com comandos como /diagram the auth flow.

Gerenciando Múltiplas Tarefas de Agentes de IA com Quadros Kanban
Um desenvolvedor compartilha sua experiência executando múltiplos agentes de IA Claude em abas de terminal e identifica três desafios principais no fluxo de trabalho: falta de visibilidade do progresso, perda de contexto ao alternar entre tarefas e interrupções por limite de taxa. Sua solução envolve tratar tarefas de IA como itens de trabalho em um quadro Kanban.

Corvo: Plataforma MCP de Código Aberto Adiciona Memória Persistente e Compartilhamento P2P a Frontends de LLM
Crow é uma plataforma de servidor MCP de código aberto e auto-hospedada que fornece frontends de LLM com memória persistente baseada em SQLite, ferramentas de pesquisa estruturada e compartilhamento ponto a ponto criptografado. Funciona com qualquer cliente compatível com MCP, como Claude Desktop, Cursor ou Windsurf, e não requer dependência de nuvem por padrão.