O motor de RPG solo de código aberto utiliza três instâncias do Claude para análise, narração e direção.

Arquitetura e Pipeline
EdgeTales é um motor de RPG solo baseado em Python onde os jogadores digitam ações do personagem, mecânicas de dados resolvem os resultados nos bastidores, e a IA Claude escreve prosa atmosférica com base nos resultados. O princípio de design central é "a IA narra, ela não decide" — os dados determinam o sucesso ou fracasso, enquanto o Claude apenas transforma os resultados em história.
O sistema utiliza um pipeline de IA tripla com três instâncias do Claude por turno do jogador:
- Cérebro (Claude Haiku): Analisa a entrada de texto livre em JSON estruturado com campos como ação de RPG, atributo, NPC alvo, nível de posição/efeito. Leva ~300ms e custa ~$0.0002.
- Narrador (Claude Sonnet): Recebe prompts estruturados com resultados dos dados, contexto do NPC e arco da história, então escreve prosa atmosférica. Também incorpora metadados ocultos (
<new_npcs>,<memory_updates>) que o analisador extrai para atualizações do estado do jogo. Leva ~2s e custa ~$0.003. - Diretor (Claude Haiku): Executa de forma assíncrona após o jogador ver a narração. Analisa cenas como um showrunner de TV para dicas de comportamento de NPCs, rastreamento de linhas narrativas e resumos de cenas. Só é acionado em eventos específicos (rolagens falhas, novos NPCs, a cada 3ª cena) com latência zero para o jogador.
O custo total por turno é de ~$0.003–0.004, fazendo com que uma sessão de 20 cenas custe ~6–8 centavos. A saída do Diretor vai para tags <director_guidance> no próximo prompt do Narrador, com degradação graciosa se o Diretor falhar.
Detalhes de Implementação Técnica
Lições de Engenharia de Prompts:
- A injeção de contexto XML estruturado (
<world>,<character>,<npc>,<story_arc>,<director_guidance>) tornou a saída do Sonnet mais consistente do que instruções em prosa. - Haiku é eficaz para análise estruturada — o Cérebro retorna JSON válido com 8+ campos a partir de entrada multilingue de forma livre.
- O reparo de JSON é essencial. Ambos os modelos ocasionalmente produzem JSON malformado (vírgulas ausentes em texto alemão, novas linhas não escapadas, vírgulas finais). Uma função
_repair_json()com abordagem de tentativa primeiro lida com isso sem sobrecarga para JSON válido. - A deduplicação de NPCs usa três redes de segurança: tags explícitas
<npc_rename>, correspondência aproximada de substrings antes da criação e busca com reconhecimento de apelidos.
Sistema de Memória de NPC: Cada NPC tem memória ponderada por importância calculada como Pontuação = 0.40 × Recência + 0.35 × Importância + 0.25 × Relevância. O Diretor gera "reflexões" (como um NPC se sente) junto com observações factuais. A memória permanece limitada a 25 entradas por NPC com consolidação inteligente.
Stack Técnico: Python 3.11+, NiceGUI, SDK Anthropic, EdgeTTS/Chatterbox (TTS), Faster-Whisper (STT). A base de código tem ~6.800 linhas em 5 arquivos. Os recursos incluem 20+ idiomas de narração, E/S de voz, exportação para PDF, modo amigável para crianças e compatibilidade com Raspberry Pi.
📖 Leia o código-fonte completo: r/ClaudeAI
👀 See Also

clarp: Substituição Open Source para Claude - Preço Medido Antes de 15 de Junho
Claude -p passa a ter precificação por consumo em 15 de junho. clarp é um CLI open source que o substitui em fluxos de trabalho locais — basta trocar o nome do binário de claude para clarp.

Cavernícola: Uma Habilidade de Código do Claude que Corta 75% dos Tokens Usando Fala Estilo Caverna
Caveman é uma habilidade do Claude Code que reduz o uso de tokens em aproximadamente 75% ao fazer o Claude responder em um estilo conciso, como um homem das cavernas, mantendo total precisão técnica. É instalado via npx ou pela loja de plugins do Claude.

Painel local monitora o uso do Claude Code com custos de tokens, chamadas de ferramentas e análises de sessão
Um desenvolvedor criou um painel local que lê os arquivos de sessão JSONL do Claude Code para visualizar o uso de tokens, custos estimados, detalhamento de chamadas de ferramentas e histórico de sessões. A ferramenta funciona inteiramente na sua máquina com uma API Express e um painel React.

TRELLIS.2 Image-to-3D Portado para Executar Nativamente em Apple Silicon
Um desenvolvedor portou o modelo TRELLIS.2 da Microsoft, de 4 bilhões de parâmetros para conversão de imagem em 3D, para rodar nativamente no Apple Silicon via PyTorch MPS, substituindo operações específicas do CUDA por alternativas em PyTorch puro. A versão portada gera malhas com cerca de 400 mil vértices a partir de fotos únicas em aproximadamente 3,5 minutos no M4 Pro com 24 GB de memória.