Arquitetura de Memória Vektori: Grafo Hierárquico 3 Camadas

Princípios da Arquitetura de Memória

A equipe do Claude Code compartilhou como seu sistema de memória funciona, revelando princípios-chave: a memória é um índice, não um armazenamento. O MEMORY.md contém apenas ponteiros (150 caracteres por linha), com o conhecimento real em arquivos separados buscados sob demanda. Transcrições brutas nunca são carregadas—apenas pesquisadas (grepped) quando necessário. Existem três camadas, cada uma com custos de acesso diferentes. O princípio mais agudo: se algo é derivável, não o armazene. A recuperação é cética—a memória é uma pista, não a verdade, e o modelo verifica antes de usar.

Implementação do Vektori

O Vektori aplica os mesmos princípios com uma forma diferente. Enquanto o Claude usa uma hierarquia de arquivos, o Vektori implementa um grafo hierárquico de sentenças com três camadas:

CAMADA DE FATOS (L0) — Declarações precisas que servem como superfície de busca. Barata e sempre consultável.
CAMADA DE EPISÓDIOS (L1) — Episódios entre conversas, descobertos automaticamente.
CAMADA DE SENTENÇAS (L2) — Conversa bruta, buscada apenas quando explicitamente necessário.

O mesmo modelo de acesso se aplica: L0 é seu índice, L2 é sua transcrição (pesquisada, não despejada). Você paga pelo que precisa.

Disciplina Rigorosa de Escrita

Nada entra na L0 sem passar por filtros de qualidade: contagem mínima de caracteres, verificação de densidade de conteúdo, proporção de pronomes. Se uma sentença for muito vaga ou puramente preenchimento, ela nunca se torna um fato. Isso corresponde ao princípio do Claude de não armazenar coisas deriváveis.

Mecânica de Recuperação

A recuperação funciona como o Claude descreve: pontuada, limitada por um limiar, cética. Pontuação mínima de 0,3 antes que qualquer coisa surja. Os resultados são classificados por similaridade vetorial mais decaimento temporal, não recuperados cegamente.

Divergência Arquitetônica sobre Correções

A abordagem do Claude otimiza para contextos de projeto de usuário único, onde o estado mais recente importa. O Vektori, projetado para agentes trabalhando em centenas de sessões, preserva o histórico de correções. Quando um usuário muda de ideia, o fato antigo permanece no grafo com seus links de sentença, permitindo rastrear o que foi dito antes da mudança e por que foi substituído.

Desempenho e Futuro

No LongMemEval-S, o Vektori alcançou 73% de precisão na profundidade L1 usando BGE-M3 + Gemini Flash-2.5-lite. A resolução de conflitos de múltiplos saltos—onde você raciocina sobre como um fato mudou ao longo do tempo—é onde os sistemas baseados em triplos (sujeito-objeto-predicado) colapsam. A próxima camada envolve armazenar o porquê: arestas causais entre eventos ("usuário corrigiu X, agente atualizou Y, usuário contestou novamente") extraídas de forma assíncrona e consultáveis como um grafo. As trajetórias do agente se tornam memória—o próprio comportamento do agente se torna parte do que ele pode raciocinar.

📖 Leia a fonte completa: r/ClaudeAI

Arquitetura de Memória do Vektori: Princípios do Sistema Vazado do Claude

Princípios da Arquitetura de Memória

Implementação do Vektori

Disciplina Rigorosa de Escrita

Mecânica de Recuperação

Divergência Arquitetônica sobre Correções

Desempenho e Futuro

👀 See Also

nervx: Ferramenta CLI reduz o uso de tokens do Claude Code analisando a estrutura do código-fonte

CogniLayer: Um Servidor MCP para Memória Persistente no Claude Code

Architect CLI: Ferramenta de código aberto para orquestrar agentes de IA headless em CI/CD

Estagiário de física da Hugging Face: Framework multiagente dobra Gemini no benchmark CritPt