Verwendung von Claude zur Datenextraktion aus einem Football-Manager-Spiel von 1997

Ben Nuttall hat FIFA Soccer Manager 97 (FSM97) mithilfe von Claude als Datenextraktions-Assistenten reverse-engineered. Er richtete Claude auf das per Wine installierte Spielverzeichnis, woraufhin die KI SM97.DAT lokalisierte und Spielernamen, Statistiken, Vereinszuordnungen, Stadien und Managerdaten extrahierte – alles abgebildet auf reale Fußballentitäten. Ziel war Reproduzierbarkeit: Die gesamte Pipeline ist nun als Python-Skripte auf GitHub verfügbar.
Schlüsseldetails
- Quelldatei:
SM97.DATenthält alle Spieldaten, einschließlich vollständiger Spielernamen (z.B. „David Beckham“ statt „D. Beckham“ im Spiel), Stadionnamen, Vereins-Spitznamen und sogar Manager, die im Spiel nie angezeigt werden. - Erste Abfrage: Claude beantwortete einfache Fragen (größtes Stadion, bestbewerteter Spieler) durch direktes Lesen der Binärdatei.
- CSV-Export: Claude generierte CSV-Dateien für alle Daten; die Spaltennamen für Spielerstatistiken waren unbekannt, daher startete Nuttall das Spiel, um sie zu ermitteln (z.B. unter Verwendung von David Seamans Statistiken als Kalibrierungsreferenz).
- Seitengenerierung: Nach der Korrektur einiger halluzinierter Datenpunkte erstellte Claude eine verlinkte HTML-Seite unter fsm.bennuttall.com, die Spieler, Vereine, Stadien und Wissenswertes zeigt.
- Datenkorrekturen: Abgekürzte Teamnamen wie „Sheffield W“ wurden zu „Sheffield Wednesday“ erweitert. Tippfehler in Stadien (z.B. „Bramall Lane Ground“) wurden korrigiert, ohne die Spieldaten zu verändern.
- Entdeckte Easter Eggs: Der Olympiasieger Daley Thompson erscheint als Spieler bei Mansfield Town. Spieler-Manager-Beziehungen wurden erkannt (z.B. Spieler, der auch als Manager für denselben Verein gelistet ist).
- Geteilte Stadien: Vereine wie Crystal Palace und Wimbledon nutzen beide Selhurst Park; die Daten erfassen dies nun.
- Top-Statistikseiten: Generierte Listen der bestbewerteten Spieler, besten Spieler nach Altersgruppe, besten Spieler-Manager und Stadien nach Kapazität. Bemerkenswert ist, dass der Verein „EA All Stars“ fiktive hochbewertete Spieler enthält.
Reproduzierbarkeit
Der gesamte Python-Code zur Datenextraktion und zum Aufbau der Website ist Open Source auf GitHub. Andere können dieselbe Pipeline ohne Claude oder ein KI-Tool ausführen, indem sie die veröffentlichten CSVs und Skripte verwenden.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

Aufbau und Test eines MCP-Servers in Claude Desktop: Architektur und Erkenntnisse
Ein Entwickler teilt seine Erfahrungen beim Aufbau und Testen eines MCP-Servers in Claude Desktop und erläutert seine Architektur sowie praktische Erkenntnisse zu Tool-Schemata, Debugging und Einschränkungen.

CAL: Open-Source Kontextoptimierungsschicht für LLM-Agenten
CAL (Context Assembly Layer) ist eine Python-Bibliothek, die die Claude-API-Token-Nutzung durch intelligente Kontextauswahl und -komprimierung um 83% reduziert. Sie ist über pip install verfügbar und unter MIT-Lizenz lizenziert.

cowork-session-sync v1.0.0 bietet Sitzungskontinuität für Claude Cowork.
cowork-session-sync v1.0.0 ist ein Tool, das die Sitzungskontinuität für Claude Cowork aufrechterhält, indem es Rohprotokolle archiviert, sie zu Markdown zusammenfasst und mit 'catchup-bunny' einen Ein-Satz-Start ermöglicht, um den vollständigen Kontext wiederherzustellen.

Selbstaktualisierendes Übersetzungssystem für OpenClaw verwaltet Fachglossare automatisch
Ein Python-Skript umschließt die Kimi2.5-API, um .srt-Dateien zu übersetzen, während Blockindizes, Zeitstempel und Segmentierung erhalten bleiben. Das System verwendet Projektprofile mit glossary.json, style.md und memory.jsonl-Dateien und enthält einen Cron-Job, der alle 6 Stunden offizielle Quellen scannt, um die Terminologie zu aktualisieren.