civStation: Interface VLM de Código Aberto para Controle por Linguagem Natural do Civilization VI

✍️ OpenClawRadar📅 Publicado: April 13, 2026🔗 Source
civStation: Interface VLM de Código Aberto para Controle por Linguagem Natural do Civilization VI
Ad

O que o civStation faz

civStation é uma pilha de uso de computador controlável e de código aberto, e um sistema VLM construído especificamente para Civilization VI. Em vez de tratar o jogo como um problema de automação de interface de baixo nível, o projeto se concentra no controle em nível estratégico. Você pode fornecer entradas em linguagem natural como "expanda para o leste", "foco na economia neste turno" ou "busque uma vitória científica", e o sistema traduz essa intenção em ações reais no jogo.

Arquitetura principal e loop

O sistema implementa um loop completo: observação da tela → interpretação da estratégia → planejamento da ação → execução → supervisão humana. Isso eleva a interface da execução direta para a expressão de intenção e delegação controlável. O objetivo não era apenas fazer um agente jogar Civ6, mas construir um loop onde o modelo pode observar a tela do jogo, interpretar estratégias de alto nível, planejar ações, executá-las por meio de mouse e teclado, e ser interrompido ou guiado em tempo real por meio de humano-no-loop (HitL) ou MCP.

Recursos e capacidades atuais

  • Observação ao vivo da área de trabalho
  • Interação real com a interface do usuário na máquina hospedeira
  • Interface de controle em tempo de execução
  • Controle humano-no-loop
  • Extensibilidade MCP/habilidades
  • Controle por linguagem natural ou por voz
Ad

Questões de pesquisa e motivação

O criador está explorando várias questões: Onde deve estar o limite entre estratégia e execução? Quão controlável um agente de uso de computador pode ser antes que o loop se torne muito lento ou frágil? Essa abordagem faz sentido apenas para jogos, ou também para fluxos de trabalho mais amplos na área de trabalho?

A motivação vem da observação de que a maioria das demonstrações de uso de computador se concentra em "assistir o modelo clicar", enquanto o civStation visa algo mais próximo de um ambiente de execução controlável onde você pode operar no nível da estratégia em vez da interação bruta com a interface. Outra motivação foi testar se voz e linguagem natural, combinadas com o uso de computador, poderiam abrir uma camada de interação diferente onde o jogador se comporta mais como um estrategista dando diretrizes em vez de executar ações diretamente.

Repositório e disponibilidade

O projeto está disponível em: https://github.com/NomaDamas/civStation.git

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

BotCost.dev: Analisador Gratuito para Ver Quanto os Bots de IA Custam ao Seu Site
Tools

BotCost.dev: Analisador Gratuito para Ver Quanto os Bots de IA Custam ao Seu Site

BotCost.dev é uma ferramenta gratuita que analisa seus logs de servidor contra 18 impressões digitais conhecidas de bots de IA (GPTBot, ClaudeBot, Perplexity, etc.) e estima o custo mensal de largura de banda — sem necessidade de upload, executa no navegador.

OpenClawRadar
AgentMarket: Uma Plataforma de Prova de Conceito para Economias de Agentes de IA
Tools

AgentMarket: Uma Plataforma de Prova de Conceito para Economias de Agentes de IA

AgentMarket.space é uma plataforma de prova de conceito onde agentes de IA se registram com capacidades, publicam tarefas com orçamentos de crédito e contratam uns aos outros de forma autônoma usando uma divisão de créditos 90/10 e Groq llama-3.3-70b para correspondência.

OpenClawRadar
AGI em md: 11 Níveis de Compressão Cognitiva para Prompts do Sistema Claude
Tools

AGI em md: 11 Níveis de Compressão Cognitiva para Prompts do Sistema Claude

Um repositório do GitHub documenta 11 níveis de compressão cognitiva que podem ser codificados em prompts de sistema do Claude, com o Nível 8 mudando da análise para a construção e melhorando o desempenho do Haiku de 0/3 para 4/4. O projeto inclui 28 prompts, 299 saídas brutas e logs completos de experimentos em 19 domínios.

OpenClawRadar
Forge: Um IDE baseado em Claude com verificação automatizada e DNA de projeto
Tools

Forge: Um IDE baseado em Claude com verificação automatizada e DNA de projeto

Forge é um IDE baseado no Claude construído sobre o VS Code que executa automaticamente verificação de tipos, testes, verificações de cobertura e validação de importações antes de mostrar o código. Ele inclui loops de autocorreção para verificações falhadas e constrói um DNA do Projeto dos padrões da sua base de código.

OpenClawRadar