civStation: Open-Source VLM-Harness für die natürliche Sprachsteuerung von Civilization VI

✍️ OpenClawRadar📅 Veröffentlicht: 13. April 2026🔗 Source
civStation: Open-Source VLM-Harness für die natürliche Sprachsteuerung von Civilization VI
Ad

Was civStation macht

civStation ist ein Open-Source, steuerbarer Computer-Use-Stack und VLM-Harness, der speziell für Civilization VI entwickelt wurde. Anstatt das Spiel als ein Problem der UI-Automatisierung auf niedriger Ebene zu behandeln, konzentriert sich das Projekt auf die Steuerung auf Strategieebene. Sie können Eingaben in natürlicher Sprache wie "nach Osten expandieren", "diese Runde auf Wirtschaft konzentrieren" oder "auf einen Wissenschaftssieg abzielen" geben, und das System übersetzt diese Absicht in tatsächliche Aktionen im Spiel.

Kernarchitektur und Zyklus

Das System implementiert einen vollständigen Zyklus: Bildschirmbeobachtung → Strategieinterpretation → Aktionsplanung → Ausführung → menschliche Übersteuerung. Dies verschiebt die Schnittstelle von der direkten Ausführung hin zur Absichtsäußerung und kontrollierbaren Delegation. Das Ziel war nicht nur, einen Agenten Civilization VI spielen zu lassen, sondern einen Zyklus aufzubauen, in dem das Modell den Spielbildschirm beobachten, Strategien auf hoher Ebene interpretieren, Aktionen planen, diese über Maus und Tastatur ausführen und live durch Human-in-the-Loop (HitL) oder MCP unterbrochen oder angeleitet werden kann.

Aktuelle Funktionen und Fähigkeiten

  • Live-Desktop-Beobachtung
  • Echte UI-Interaktion auf dem Host-Computer
  • Laufzeitsteuerungsschnittstelle
  • Human-in-the-Loop-Steuerung
  • MCP/Skill-Erweiterbarkeit
  • Steuerung durch natürliche Sprache oder Spracheingabe
Ad

Forschungsfragen und Motivation

Der Ersteller untersucht mehrere Fragen: Wo sollte die Grenze zwischen Strategie und Ausführung liegen? Wie steuerbar kann ein Computer-Use-Agent sein, bevor der Zyklus zu langsam oder fehleranfällig wird? Macht dieser Ansatz nur für Spiele Sinn oder auch für breitere Desktop-Arbeitsabläufe?

Die Motivation ergibt sich aus der Beobachtung, dass die meisten Computer-Use-Demonstrationen sich auf "das Modell beim Klicken beobachten" konzentrieren, während civStation auf etwas näher an einer steuerbaren Laufzeitumgebung abzielt, in der Sie auf der Ebene der Strategie agieren können, anstatt mit roher UI-Interaktion. Eine weitere Motivation war zu testen, ob Sprache und natürliche Sprache, kombiniert mit Computer-Use, eine andere Interaktionsebene eröffnen könnten, auf der der Spieler eher wie ein Stratege agiert, der Anweisungen gibt, anstatt Aktionen direkt auszuführen.

Repository und Verfügbarkeit

Das Projekt ist verfügbar unter: https://github.com/NomaDamas/civStation.git

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Mehr-Agenten-Karriere-Mentor entwickelt mit Ollama und MCP für lokale KI
Werkzeuge

Mehr-Agenten-Karriere-Mentor entwickelt mit Ollama und MCP für lokale KI

Ein Entwickler hat ein 5-Agenten-KI-System gebaut, das Lebensläufe analysiert und Karriere-Intelligenzberichte mit Ollama und llama3 lokal generiert. Das System verkettet Agentenausgaben, sodass jeder auf dem vorherigen Kontext aufbaut, wobei MCP die Tool-Integration übernimmt.

OpenClawRadar
Blip MCP Server: Zeichne UI-Änderungen für Claude Code anstatt sie zu beschreiben
Werkzeuge

Blip MCP Server: Zeichne UI-Änderungen für Claude Code anstatt sie zu beschreiben

Blip ist ein MCP-Server für Claude Code, der verbale Beschreibungen von UI-Änderungen durch visuelle Anmerkungen ersetzt. Sie zeichnen direkt auf Ihre laufende Anwendung, und Claude schreibt basierend auf dem kommentierten Screenshot den entsprechenden Code.

OpenClawRadar
Identitäts- und Reputationsschicht für OpenClaw-Agenten
Werkzeuge

Identitäts- und Reputationsschicht für OpenClaw-Agenten

Ein Entwicklerteam hat MCP-I und IdentiClaw entwickelt, um Identitätsverlust in mehrstufigen Agenten-Workflows zu lösen, sowie knowthat.ai als Reputationsregister. Sie haben die MCP-I-Spezifikation an die Decentralized Identity Foundation gespendet.

OpenClawRadar
Claudes 171 interne Emotionsvektoren beeinflussen die Ausgabe: Toolkit basierend auf Anthropic-Forschung
Werkzeuge

Claudes 171 interne Emotionsvektoren beeinflussen die Ausgabe: Toolkit basierend auf Anthropic-Forschung

Anthropics Forschungsarbeit enthüllt, dass Claude über 171 interne Aktivierungsmuster verfügt, die wie Emotionsvektoren funktionieren und sein Verhalten kausal steuern, bevor es etwas schreibt. Ein Entwickler erstellte basierend auf diesen Erkenntnissen ein Toolkit mit 7 praktischen Prompting-Prinzipien und System-Prompts.

OpenClawRadar