civStation: Открытая платформа VLM для управления игрой Civilization VI с помощью естественного языка

Что делает civStation
civStation — это открытый, управляемый стек компьютерного использования и оболочка VLM, созданная специально для Civilization VI. Вместо того чтобы рассматривать игру как проблему низкоуровневой автоматизации интерфейса, проект фокусируется на управлении на уровне стратегии. Вы можете давать команды на естественном языке, такие как «расширяться на восток», «сосредоточиться на экономике в этот ход» или «стремиться к научной победе», и система преобразует это намерение в реальные внутриигровые действия.
Основная архитектура и цикл
Система реализует полный цикл: наблюдение экрана → интерпретация стратегии → планирование действий → выполнение → вмешательство человека. Это смещает интерфейс вверх — от прямого выполнения к выражению намерения и управляемому делегированию. Цель состояла не просто в том, чтобы создать агента, играющего в Civ6, а в построении цикла, в котором модель может наблюдать за игровым экраном, интерпретировать высокоуровневую стратегию, планировать действия, выполнять их с помощью мыши и клавиатуры, а также быть прерванной или направляемой в реальном времени через человеческое вмешательство (HitL) или MCP.
Текущие функции и возможности
- Наблюдение за рабочим столом в реальном времени
- Реальное взаимодействие с интерфейсом на основном компьютере
- Интерфейс управления во время выполнения
- Управление с участием человека
- Расширяемость через MCP/навыки
- Управление с помощью естественного языка или голоса
Исследовательские вопросы и мотивация
Создатель исследует несколько вопросов: Где должна проходить граница между стратегией и выполнением? Насколько управляемым может быть агент компьютерного использования, прежде чем цикл станет слишком медленным или ненадёжным? Имеет ли этот подход смысл только для игр или также для более широких рабочих процессов на рабочем столе?
Мотивация проистекает из наблюдения, что большинство демонстраций компьютерного использования сосредоточены на «смотрите, как модель кликает», в то время как civStation стремится к чему-то более близкому к управляемой среде выполнения, где вы можете работать на уровне стратегии, а не на уровне сырого взаимодействия с интерфейсом. Другой мотивацией было проверить, могут ли голос и естественный язык в сочетании с компьютерным использованием открыть другой слой взаимодействия, где игрок ведёт себя скорее как стратег, отдающий указания, а не непосредственно выполняющий действия.
Репозиторий и доступность
Проект доступен по адресу: https://github.com/NomaDamas/civStation.git
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Крэг: Инструмент с открытым исходным кодом создает единые правила для ИИ-агентов на основе конфигураций проектов.
Crag — это компилятор с открытым исходным кодом, который анализирует конфигурации проекта, генерирует единый файл governance.md, а затем компилирует его в несколько файлов правил для ИИ-агентов, чтобы предотвратить расхождение конфигураций в таких инструментах, как Claude Code, Cursor и Copilot.

Плагин HomeClaw соединяет Apple HomeKit с OpenClaw.
HomeClaw — это плагин OpenClaw, который подключает устройства Apple Home/HomeKit к OpenClaw. Для сборки и запуска требуется аккаунт разработчика Apple из-за ограничений Apple HomeKit для нотариально заверенных дистрибутивов.

OpenYak: Открытый настольный ИИ-агент для локального управления файлами и автоматизации
OpenYak — это открытый настольный ИИ-ассистент, который работает полностью на вашем компьютере, предлагая управление файлами, анализ данных и автоматизацию офисных задач с доступом к 100+ ИИ-моделям через OpenRouter и 20+ провайдерам BYOK.

Два месяца с Spec-Kit от GitHub и Claude Code: что работает, что нет
Разработчик делится практическими заметками об использовании инструментария Spec-Driven Development от GitHub с Claude Code, охватывая пятифазовый рабочий процесс, проблемы рассинхронизации, компромиссы по накладным расходам и советы по настройке.