Arquitetura de Memória do Vektori: Princípios do Sistema Vazado do Claude

Princípios da Arquitetura de Memória
A equipe do Claude Code compartilhou como seu sistema de memória funciona, revelando princípios-chave: a memória é um índice, não um armazenamento. O MEMORY.md contém apenas ponteiros (150 caracteres por linha), com o conhecimento real em arquivos separados buscados sob demanda. Transcrições brutas nunca são carregadas—apenas pesquisadas (grepped) quando necessário. Existem três camadas, cada uma com custos de acesso diferentes. O princípio mais agudo: se algo é derivável, não o armazene. A recuperação é cética—a memória é uma pista, não a verdade, e o modelo verifica antes de usar.
Implementação do Vektori
O Vektori aplica os mesmos princípios com uma forma diferente. Enquanto o Claude usa uma hierarquia de arquivos, o Vektori implementa um grafo hierárquico de sentenças com três camadas:
- CAMADA DE FATOS (L0) — Declarações precisas que servem como superfície de busca. Barata e sempre consultável.
- CAMADA DE EPISÓDIOS (L1) — Episódios entre conversas, descobertos automaticamente.
- CAMADA DE SENTENÇAS (L2) — Conversa bruta, buscada apenas quando explicitamente necessário.
O mesmo modelo de acesso se aplica: L0 é seu índice, L2 é sua transcrição (pesquisada, não despejada). Você paga pelo que precisa.
Disciplina Rigorosa de Escrita
Nada entra na L0 sem passar por filtros de qualidade: contagem mínima de caracteres, verificação de densidade de conteúdo, proporção de pronomes. Se uma sentença for muito vaga ou puramente preenchimento, ela nunca se torna um fato. Isso corresponde ao princípio do Claude de não armazenar coisas deriváveis.
Mecânica de Recuperação
A recuperação funciona como o Claude descreve: pontuada, limitada por um limiar, cética. Pontuação mínima de 0,3 antes que qualquer coisa surja. Os resultados são classificados por similaridade vetorial mais decaimento temporal, não recuperados cegamente.
Divergência Arquitetônica sobre Correções
A abordagem do Claude otimiza para contextos de projeto de usuário único, onde o estado mais recente importa. O Vektori, projetado para agentes trabalhando em centenas de sessões, preserva o histórico de correções. Quando um usuário muda de ideia, o fato antigo permanece no grafo com seus links de sentença, permitindo rastrear o que foi dito antes da mudança e por que foi substituído.
Desempenho e Futuro
No LongMemEval-S, o Vektori alcançou 73% de precisão na profundidade L1 usando BGE-M3 + Gemini Flash-2.5-lite. A resolução de conflitos de múltiplos saltos—onde você raciocina sobre como um fato mudou ao longo do tempo—é onde os sistemas baseados em triplos (sujeito-objeto-predicado) colapsam. A próxima camada envolve armazenar o porquê: arestas causais entre eventos ("usuário corrigiu X, agente atualizou Y, usuário contestou novamente") extraídas de forma assíncrona e consultáveis como um grafo. As trajetórias do agente se tornam memória—o próprio comportamento do agente se torna parte do que ele pode raciocinar.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

nervx: Ferramenta CLI reduz o uso de tokens do Claude Code analisando a estrutura do código-fonte
nervx é uma ferramenta CLI instalável via pip que analisa repositórios com tree-sitter, constrói um grafo SQLite de funções e imports, e gera um mapa estrutural NERVX.md. Ela adiciona automaticamente instruções ao CLAUDE.md que ensinam Claude a usar a navegação nervx, reduzindo buscas grep em 65% e tokens de saída em 48% nos testes.

CogniLayer: Um Servidor MCP para Memória Persistente no Claude Code
CogniLayer é um servidor MCP de código aberto que fornece memória persistente para o Claude Code entre sessões, utilizando um banco de dados SQLite com busca de texto completo FTS5 e incorporações vetoriais. Ele resolve o problema do Claude esquecer o contexto do projeto entre sessões.

Architect CLI: Ferramenta de código aberto para orquestrar agentes de IA headless em CI/CD
Architect é uma ferramenta CLI de código aberto projetada para agentes de IA autônomos em pipelines de CI/CD, apresentando o Ralph Loop para ciclos de teste e repetição, guardrails determinísticos, definições de pipeline em YAML e suporte para múltiplos LLMs via LiteLLM.
Estagiário de física da Hugging Face: Framework multiagente dobra Gemini no benchmark CritPt
Hugging Face lançou physics-intern, um framework multiagente para pesquisa em física teórica que dobra o desempenho dos modelos Gemini no benchmark CritPt e estabelece um novo SOTA em relação ao GPT-5.5 Pro com custo mais baixo.