Arquitetura de Prompt de Código Claude Engenharia Reversa para Modelos Locais

Um repositório no GitHub contém uma reimplementação completa e legalmente limpa da arquitetura de prompts do Claude Code, projetada para desenvolvedores que constroem agentes de codificação em modelos locais.
Detalhes Principais
O repositório documenta a arquitetura completa de prompts que o Claude Code utiliza, originalmente obtida de um breve lançamento público no npm. O autor estudou cada prompt e usou o próprio Claude para ajudar a reescrever toda a coleção do zero. O resultado são 26 prompts no total, cobrindo:
- Estrutura de prompt de sistema que realmente controla o comportamento (não apenas "você é um assistente útil")
- Prompts de ferramentas que impedem o modelo de usar o shell quando existe uma ferramenta dedicada
- Regras de segurança que controlam ações destrutivas sem serem excessivamente restritivas
- Compressão de memória para sessões longas (crítico para janelas de contexto menores)
- Padrões de verificação que detectam quando o modelo está racionalizando em vez de testar
Os prompts são organizados em categorias: sistema, ferramentas, agentes, memória, coordenação e utilitários. Os padrões de prompt são independentes do modelo e podem ser adaptados para qualquer modelo que suporte o uso de ferramentas.
Status Legal
Cada prompt é escrito de forma independente com redação diferente. O autor verificou que não houve cópia literal por meio de verificações automatizadas. O repositório inclui um aviso legal completo cobrindo uso justo nominativo, não afiliação com a Anthropic e uma política de resposta ao DMCA. Isso é descrito como uma reimplementação em estilo sala limpa, não uma cópia.
O projeto tem licença MIT e está disponível em https://github.com/swati510/claude-code-prompts.
Esta arquitetura é particularmente útil para construir fluxos de trabalho agenticos com Ollama, llama.cpp ou vLLM.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

A Otimização da ANE por Meio de Experimentos de IA Direcionados por Telefone Mostra Benefícios da Fusão de Kernel
Um desenvolvedor realizou 55 experimentos de otimização no Apple Neural Engine, conduzindo o processo a partir de seu telefone usando o Claude para brainstorming. As principais melhorias incluíram a fusão de 3 kernels ANE em 1 mega-kernel, reduzindo a perda de validação de 3,75 para 2,49 e o tempo por etapa de 176ms para 96ms.

Fluxo de trabalho de codificação autônoma envia 163 mil linhas durante a noite usando Claude Code
Um desenvolvedor criou um fluxo de trabalho autônomo que completou 72 tarefas durante a noite, gerando 163.643 linhas de código e mais de 6.400 testes aprovados com uma taxa de sucesso de 85% na primeira tentativa.

free-claude-code adiciona suporte GLM-5 via NVIDIA NIM e se expande para OpenRouter e Discord
O free-claude-code agora oferece suporte ao GLM-5 através do nível gratuito do NVIDIA NIM (40 requisições/min) e adiciona integração com OpenRouter, suporte a bot do Discord e compatibilidade com provedor local LMStudio. A ferramenta converte as requisições da API Anthropic do Claude Code para funcionar com backends de modelos alternativos.

SendToAI Extensão do VS Code Resolve o Limite de 20 Arquivos do Claude com Agrupamento de Projetos
SendToAI é uma extensão gratuita do VS Code que agrupa projetos inteiros em uma única colagem na área de transferência, contornando o limite de upload de 20 arquivos do Claude. Inclui seleção visual de arquivos, contagem de tokens, estimativas de custo e notas de projeto que persistem entre sessões.