GSD-Lite: Uma Máquina de Estado para Código Claude que Impõe TDD e Previne a Omissão de Testes

GSD-Lite é um servidor MCP de código aberto que se acopla ao Claude Code e executa projetos por meio de uma máquina de fluxo de trabalho de 12 estados. A ferramenta é licenciada pelo MIT e consiste em cerca de 15 arquivos-fonte no total.
Como Funciona
Após planejar o que construir em conversa com o Claude, o GSD-Lite assume automaticamente: escrever código, revisá-lo, verificá-lo, avançar para a próxima fase. O ciclo de execução segue este padrão:
- Orquestrador escolhe a próxima tarefa
- Executor escreve o código (TDD, ponto de verificação)
- Revisor verifica (contexto separado, especificação + qualidade)
- Aprovado? Próxima tarefa. Rejeitado? Refazer.
- Todas as tarefas concluídas? Verificação do portão de fase
- Portão passa? Próxima fase
- Todas as fases concluídas? Você terminou
Recursos Principais
Imposição de TDD: A "Lei de Ferro" está embutida em cada despacho de tarefa: nenhum código de produção sem um teste que falhe primeiro. O prompt lista as racionalizações exatas que o Claude usa para pular testes ("Esta é apenas uma alteração de configuração", "Os testes existentes já cobrem isso") e as sinaliza como desculpas conhecidas.
Contextos de Agentes Separados: As revisões são executadas em um contexto de agente separado, onde o revisor nunca vê o raciocínio do executor—apenas o diff e a especificação da tarefa. Isso evita aprovações automáticas e ajuda a capturar bugs reais.
Agente Depurador: Quando uma tarefa falha 3 vezes, em vez de outra tentativa, um agente depurador é despachado. Este agente separado reproduz a falha, formula hipóteses, testa-as, identifica onde a correção deve ser aplicada e, em seguida, fornece as descobertas ao executor.
Rastreamento de Dependências: Se uma tarefa alterar a assinatura de uma API, qualquer coisa subsequente é invalidada e reenfileirada automaticamente.
Detalhes Técnicos
O sistema usa 6 comandos, 4 agentes e 11 ferramentas MCP. O estado é gerenciado em um arquivo JSON com validação de esquema e conflitos de versão tratados por meio de concorrência otimista.
Por Que Não a Versão Original
A primeira versão tinha 32 comandos, 12 agentes, mais de 100 arquivos-fonte e um instalador de 2400 linhas. O autor a descartou e reescreveu do zero porque a maior parte dessa complexidade estava queimando a janela de contexto sem fornecer valor.
Descobertas Inesperadas
A abordagem anti-racionalização funciona—listar frases específicas que o Claude usa para pular etapas diretamente no prompt do agente reduziu a taxa de omissão. O autor observa que exemplos negativos parecem direcionar o modelo melhor do que apenas dizer "sempre escreva testes". A persistência de sessão foi o desafio de implementação mais difícil.
📖 Read the full source: r/ClaudeAI
👀 See Also

Reutilização de Cache KV para Conversas Longas no Apple Silicon Oferece Aceleração de 200x
Um desenvolvedor implementou a reutilização de cache KV baseada em sessão para inferência de LLM local usando o framework MLX da Apple, alcançando uma melhoria de 200x no tempo para o primeiro token em contextos de 100K tokens. A abordagem mantém o cache KV na memória entre as voltas da conversa, processando apenas os novos tokens.

Desenvolvedor Cria App LibraHQ para Resolver Problema de Memória de Agentes de IA
Um desenvolvedor criou o LibraHQ, um aplicativo gratuito de anotações que serve como uma camada de memória compartilhada entre chatbots e agentes de programação. O aplicativo registra notas e decisões importantes das conversas e as armazena para sessões futuras, resolvendo o problema de agentes de IA esquecerem decisões tomadas anteriormente.

AIsbf 0.9.8 adiciona cache, melhorias de roteamento e suporte expandido a serviços de IA.
AIsbf 0.9.8 é um proxy/roteador de API que expõe uma interface compatível com OpenAI para múltiplos serviços de IA. Esta versão adiciona cache com Redis, SQLite, MySQL e baseado em arquivos, roteamento semântico aprimorado e suporte completo a OAuth2 para assinantes do Claude.ai, Amazon Kiro-cli, OpenAI Codex e Kilo.ai.

RTX 5060 Ti 16GB: Benchmarks de LLM Local - Modelos de 30B ainda lideram em programação
Benchmarks em uma RTX 5060 Ti 16GB mostram o Unsloth Qwen3-Coder-30B UD-Q3_K_XL atingindo 76,3 tok/s no Ubuntu com pontuação de qualidade 8,14, tornando-o o modelo de codificação padrão recomendado. O Unsloth Qwen3.5-35B UD-Q2_K_XL atinge 80,1 tok/s, mas com pontuações de qualidade mais baixas.