EdgeTales: Motor de RPG Solo com 3 Instâncias do Claude

Arquitetura e Pipeline

EdgeTales é um motor de RPG solo baseado em Python onde os jogadores digitam ações do personagem, mecânicas de dados resolvem os resultados nos bastidores, e a IA Claude escreve prosa atmosférica com base nos resultados. O princípio de design central é "a IA narra, ela não decide" — os dados determinam o sucesso ou fracasso, enquanto o Claude apenas transforma os resultados em história.

O sistema utiliza um pipeline de IA tripla com três instâncias do Claude por turno do jogador:

Cérebro (Claude Haiku): Analisa a entrada de texto livre em JSON estruturado com campos como ação de RPG, atributo, NPC alvo, nível de posição/efeito. Leva ~300ms e custa ~$0.0002.
Narrador (Claude Sonnet): Recebe prompts estruturados com resultados dos dados, contexto do NPC e arco da história, então escreve prosa atmosférica. Também incorpora metadados ocultos (<new_npcs>, <memory_updates>) que o analisador extrai para atualizações do estado do jogo. Leva ~2s e custa ~$0.003.
Diretor (Claude Haiku): Executa de forma assíncrona após o jogador ver a narração. Analisa cenas como um showrunner de TV para dicas de comportamento de NPCs, rastreamento de linhas narrativas e resumos de cenas. Só é acionado em eventos específicos (rolagens falhas, novos NPCs, a cada 3ª cena) com latência zero para o jogador.

O custo total por turno é de ~$0.003–0.004, fazendo com que uma sessão de 20 cenas custe ~6–8 centavos. A saída do Diretor vai para tags <director_guidance> no próximo prompt do Narrador, com degradação graciosa se o Diretor falhar.

Detalhes de Implementação Técnica

Lições de Engenharia de Prompts:

A injeção de contexto XML estruturado (<world>, <character>, <npc>, <story_arc>, <director_guidance>) tornou a saída do Sonnet mais consistente do que instruções em prosa.
Haiku é eficaz para análise estruturada — o Cérebro retorna JSON válido com 8+ campos a partir de entrada multilingue de forma livre.
O reparo de JSON é essencial. Ambos os modelos ocasionalmente produzem JSON malformado (vírgulas ausentes em texto alemão, novas linhas não escapadas, vírgulas finais). Uma função _repair_json() com abordagem de tentativa primeiro lida com isso sem sobrecarga para JSON válido.
A deduplicação de NPCs usa três redes de segurança: tags explícitas <npc_rename>, correspondência aproximada de substrings antes da criação e busca com reconhecimento de apelidos.

Sistema de Memória de NPC: Cada NPC tem memória ponderada por importância calculada como Pontuação = 0.40 × Recência + 0.35 × Importância + 0.25 × Relevância. O Diretor gera "reflexões" (como um NPC se sente) junto com observações factuais. A memória permanece limitada a 25 entradas por NPC com consolidação inteligente.

Stack Técnico: Python 3.11+, NiceGUI, SDK Anthropic, EdgeTTS/Chatterbox (TTS), Faster-Whisper (STT). A base de código tem ~6.800 linhas em 5 arquivos. Os recursos incluem 20+ idiomas de narração, E/S de voz, exportação para PDF, modo amigável para crianças e compatibilidade com Raspberry Pi.

📖 Leia o código-fonte completo: r/ClaudeAI

O motor de RPG solo de código aberto utiliza três instâncias do Claude para análise, narração e direção.

Arquitetura e Pipeline

Detalhes de Implementação Técnica

👀 See Also

Testando Agentes de IA contra APIs do Mundo Real com d3 Labs

Título do artigo: Bot de Paper Trading Multi-LLM com Claude Opus como Engenheiro Líder e Gemini como Estrategista: Análise da Arquitetura

Engenharia Reversa do Apple Neural Engine para Treinar Modelos MicroGPT

Usando um LLM Local como Subagente de Código do Claude para Reduzir o Uso de Contexto