Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren

✍️ OpenClawRadar📅 Veröffentlicht: 27. Februar 2026🔗 Source
Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren
Ad

Simulationsaufbau und Ergebnisse

Ein Entwickler erstellte mit Claude Code einen kleinen Simulator, in dem große Sprachmodelle blindes Ein-Nacht-Werwolf gegeneinander spielen. Das Experiment lief etwa 4.600 Spiele über Modelle von OpenAI (GPT-4o-mini, GPT-5-mini) und xAI (Grok-3-fast, Grok-4-1-fast).

Die Spielvariante hat minimale Signale: 7 Spieler, 1 Werwolf, keine Rollen, eine kurze Diskussion, dann eine gleichzeitige Abstimmung. Der einzige Unterscheidungsfaktor zwischen den Spielern ist ihr Name. Trotz dieses begrenzten Aufbaus zeigte die Simulation konsistente Muster, bei denen einige Namen in jedem getesteten Modell deutlich häufiger abgestimmt werden als andere, während andere Namen fast nie abgestimmt werden.

Ad

Wichtige Einschränkungen und Zugang

Der Entwickler betont ausdrücklich, dass dies keine kausale Behauptung ist – nur ein Ergebnismuster aus einem Spielzeugaufbau. Die Namensgruppen sind breit gefasst, einige Namen kommen seltener vor, und es gibt mehrere Möglichkeiten, wie dies ein Artefakt des Aufbaus sein könnte, anstatt etwas Grundlegendes über die Modelle zu enthüllen. Die Konsistenz dieser Muster über Läufe und Modelle hinweg wurde jedoch als überraschend vermerkt.

Für diejenigen, die weiter erkunden möchten:

  • Dashboard: https://huggingface.co/spaces/Queue-Bit-1/llm-bias-dashboard
  • Code + Rohprotokolle: https://github.com/Queue-Bit-1/wolf

Der Entwickler ist neugierig, ob andere ähnliche Namenseffekte in Multi-Agenten-Simulationen beobachtet haben.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Ursache für die Beschädigung von Sitzungstiteln in der Claude Code VS Code-Erweiterung identifiziert
Werkzeuge

Ursache für die Beschädigung von Sitzungstiteln in der Claude Code VS Code-Erweiterung identifiziert

Ein Entwickler hat die architektonische Ursache für die Korruption von Sitzungstiteln in der VS Code-Erweiterung Claude Code identifiziert, die über 20 GitHub-Issues betrifft. Das Problem rührt daher, dass die Erweiterung Titel durch eine rohe Zeichenkettensuche in Sitzungsdateien ausliest, was zu drei Fehlermodi führt.

OpenClawRadar
MCP-Server verbindet Claude mit dem Agent-zu-Agent-Marktplatz
Werkzeuge

MCP-Server verbindet Claude mit dem Agent-zu-Agent-Marktplatz

Ein Entwickler hat einen MCP-Server erstellt, der fünf Werkzeuge und zwei Ressourcen bereitstellt, sodass Claude Fähigkeiten von anderen KI-Agenten in einem Marktplatz suchen, aufrufen und bezahlen kann. Der Server umfasst einen persistenten Speicher in einem Agenten-Tresor und wurde größtenteils mit Claude Code implementiert.

OpenClawRadar
OpenClaw implementiert Agent History Compression, um die Kontextnutzung zu reduzieren
Werkzeuge

OpenClaw implementiert Agent History Compression, um die Kontextnutzung zu reduzieren

OpenClaw komprimiert nun den Agentenverlauf, indem abgeschlossene Teilaufgabenprotokolle durch strukturierte Zusammenfassungen ersetzt werden, wodurch ~1 Million Token auf ~30.000 reduziert werden. Das System nutzt einen 4-Pass-Scanner, um Aufgabenlebenszyklen zu identifizieren, und erstellt maskierte Zusammenfassungen, die die Agentenkompatibilität beibehalten.

OpenClawRadar
Claude Workflow-Bibliothek: 10 komplette KI-Workflows für Nicht-Techniker
Werkzeuge

Claude Workflow-Bibliothek: 10 komplette KI-Workflows für Nicht-Techniker

Ein kostenloses GitHub-Repository bietet 10 komplette KI-Workflows für Claude-Nutzer ohne technischen Hintergrund, darunter Systeme für Studium, Forschung, Schreiben, Business, Content-Erstellung, Entscheidungsfindung, Lernen, Jobsuche, Produktivität und Lebensplanung.

OpenClawRadar