Servidor de Base de Conhecimento de Código Aberto e Orquestrador Multiagente para Memória IA Persistente

Um desenvolvedor disponibilizou como código aberto um sistema que fornece memória persistente para agentes de IA de codificação entre sessões, eliminando a necessidade de copiar e colar manualmente o contexto entre conversas. A configuração conecta o Claude.ai e o Claude Code através de um servidor personalizado do Model Context Protocol (MCP) em execução em um VPS privado.
Arquitetura e Componentes
O sistema consiste em dois projetos principais de código aberto:
- Servidor de Base de Conhecimento: Atua como o cérebro central, construído com Node.js, SQLite FTS5, Express e Obsidian Sync. Ele ingere vaults do Obsidian e diretórios de memória do Claude, fornecendo busca de texto completo com resultados classificados e trechos destacados.
- Orquestrador de Agentes (Daniel): Encapsula as CLIs do Claude, Codex e Gemini, permitindo que todos os três agentes compartilhem a mesma base de conhecimento e fornecendo failover automático quando um agente atinge limites de taxa ou fica indisponível.
Principais Recursos
- Quatro ferramentas MCP:
kb_search,kb_list,kb_read,kb_ingest - Painel web para gerenciamento manual de documentos
- Comandos CLI:
kb start,kb ingest,kb search,kb register - Capacidade de autoaprendizado: a IA atualiza automaticamente seus próprios arquivos de instrução
CLAUDE.mdcom base nos resultados das sessões - Armazenamento de três camadas (frio/quente/longo prazo) para evitar desvio de contexto
- Failover multiagente sem perda de contexto durante interrupções
Implementação Técnica
A pilha tecnológica evita bancos de dados vetoriais e dependências de nuvem, usando SQLite FTS5 para busca otimizada por tokens. O fluxo de trabalho segue este caminho: Vault do Obsidian (curadoria humana) → Servidor KB (SQLite FTS5) → Interface MCP → Claude Code/Codex/Gemini (todos compartilham o mesmo cérebro).
O sistema inclui um arquivo EXTENDING.md escrito especificamente para agentes de IA lerem, permitindo que os usuários digam ao seu agente "leia EXTENDING.md e personalize isso para minha configuração" para configuração automatizada.
Em um teste real durante uma interrupção do Claude Code, o orquestrador roteou automaticamente para o Codex, que fez SSH no VPS, diagnosticou o servidor KB e forneceu comandos de recuperação — tudo acessível de um telefone via Termux sem nenhuma perda de contexto.
O desenvolvedor relata executar isso em produção com três agentes de IA premium por aproximadamente US$ 60/mês, acumulando contexto em mais de 100 sessões para permitir geração de código limpo de uma só vez com base em padrões e preferências aprendidos da base de código.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Grafo de Habilidades Transponível para Memória Persistente de Agentes de IA em Bases de Código
Um desenvolvedor criou um sistema de grafo de habilidades de três camadas que reside dentro de uma base de código, permitindo que assistentes de IA de programação mantenham memória persistente entre sessões. O sistema usa divulgação progressiva com instruções autodirigidas em vez de arquivos de contexto monolíticos.

Jan-Code-4B: Um Modelo Leve Ajustado para Código para Desenvolvimento Local
A equipe Jan lançou o Jan-Code-4B, um modelo ajustado para código com 4 bilhões de parâmetros, baseado no Jan-v3-4B-base-instruct. Ele foi projetado como uma substituição direta do Haiku no Claude Code, oferecendo assistência de codificação aprimorada enquanto é executado localmente.

ClawRelay: Proxy LLM compatível com OpenAI nativo para macOS com failover automático
ClawRelay executa um servidor HTTP compatível com OpenAI no macOS 15+ com failover automático entre provedores de LLM. Ele suporta OpenAI, Groq, Nvidia NIMs, Ollama e qualquer serviço com um endpoint /v1/chat/completions.

Passando das regras do CLAUDE.md para a aplicação de infraestrutura com Citadel
Um desenvolvedor descobriu que adicionar mais regras ao CLAUDE.md além de cerca de 100 linhas reduzia a conformidade, com 40% de redundância em seu arquivo. A solução foi transferir a aplicação das regras das instruções para a infraestrutura usando ganchos de ciclo de vida, habilidades e arquivos de campanha, culminando no sistema de código aberto Citadel.