Uma Camada de Governança de 7 Arquivos para Prevenir o Desvio de Sessão de LLM

Um desenvolvedor no r/LocalLLaMA compartilhou uma solução para impedir que assistentes de codificação baseados em LLM, como o Claude, desfaçam silenciosamente decisões arquiteturais entre sessões. Em vez de tratar as sessões de LLM como conversas, agora as tratam como processos sem estado que precisam de um protocolo.
O Problema Central
Cada sessão de LLM começa com memória zero. Você reexplica, o modelo reinterpreta e ele se desvia com confiança. O desenvolvedor observou: "Você nem vai perceber até estar bem dentro do projeto, talvez três ou quatro arquivos adiante, ou quem sabe até na última parte do projeto."
A Camada de Governança de 7 Arquivos
A solução não é um prompt melhor, mas uma camada de governança que qualquer modelo pode ler e operar imediatamente dentro dela. O sistema usa sete arquivos, cada um com uma preocupação específica, sem sobreposição:
active_context.md- Controlador da sessão, define o que está no escopo no momentocontracts.md- Lei comportamental, esquemas de dados, valores de enumeração, comportamento exigidoagent_core.md- Disciplina de execução, como operar, validar, relataragent_project.md- Intenção do projeto, por que este sistema existe, resultados esperadosdecisions.md- Registro de ADR, escolhas não óbvias e por que foram aceitasbuild_plan.md- Roteiro do módulo, ordem de implementação e entregasstate.md- Diário vivo, o que foi feito, o que mudou, o que resta
Decisões de Design Principais
O desenvolvedor explicou duas separações críticas:
Separar contracts.md de agent_core.md: "Quando um conflito comportamental aparecia, o modelo não tinha como saber a qual camada deferir. Era uma regra de esquema ou uma preferência de execução? Quando estão separados, a hierarquia é inequívoca, os contratos sempre vencem."
Incluir decisions.md: "Quase pulei isso ('Vou lembrar'). Três semanas depois, não conseguia reconstruir por que escolhemos Postgres em vez de SQLite para um módulo específico. O registro ADR existe exatamente porque 'Vou lembrar' não é um protocolo."
O Loop Operacional
Toda sessão segue esta ordem, sem exceções:
- Ler
active_context.md→ extrair o que está no escopo - Reaterrar contra
contracts.md→ regras comportamentais travadas - Confirmar restrições operacionais de
agent_core.md+agent_project.md - Verificar
decisions.md→ não reverter escolhas aceitas - Executar apenas o que
active_context.mdautoriza, conformebuild_plan.md - Validar com testes — não declarar como concluído sem evidências
- Atualizar
state.mdcom resultados factuais - Se uma nova decisão não trivial foi tomada, registrá-la em
decisions.md
Impacto no Fluxo de Trabalho
O bloqueio de escopo do active_context.md provou ser particularmente valioso: "Antes disso, eu começava uma sessão para corrigir um bug e acabava refatorando um módulo não relacionado porque 'estava ali mesmo'. Parecia produtivo......... e era."
📖 Read the full source: r/LocalLLaMA
👀 See Also

Adam: Uma Biblioteca de Agente de IA Multiplataforma Incorporável em C
Adam é uma biblioteca C que fornece um loop completo de agente com chamada de ferramentas, memória, voz e suporte a LLMs na nuvem e locais, projetada para ser embutida em qualquer aplicação.

Ferramenta de Leitura do Claude Code Reduz Imagens Silenciosamente, Causando Alucinações
A ferramenta `read` do Claude Code reduz silenciosamente a resolução das imagens antes que o modelo as veja, resultando em saída degradada e alucinações não reconhecidas ao extrair texto de capturas de tela.

O OmniCoder-9B ajustado demonstra um desempenho robusto para codificação autônoma em sistemas com 8GB de VRAM.
Um usuário do Reddit testou o OmniCoder-9B, um ajuste fino do Qwen3.5-9B em traços do Opus, com o OpenCode e relatou velocidades de mais de 40 tokens por segundo usando a quantização Q4_K_M GGUF com comprimento de contexto de 100k em um sistema com 8GB de VRAM.

MemRosetta adiciona memória persistente ao Claude Code com configuração de um único comando
MemRosetta v0.2.4 fornece ao Claude Code memória entre sessões através de um único comando npm install. A ferramenta inclui um servidor MCP com 6 ferramentas de memória, captura automática de sessões e armazenamento local em SQLite que pode ser compartilhado com o Cursor.