Autonomes Testen von Super Mario mithilfe von Verhaltensmodellen

✍️ OpenClawRadar📅 Veröffentlicht: 20. Februar 2026🔗 Source
Autonomes Testen von Super Mario mithilfe von Verhaltensmodellen
Ad

Der Artikel befasst sich mit autonomen Testmethoden, die in Super Mario Bros. eingesetzt werden, und verwendet einen verhaltensmodellspezifischen Ansatz. Dies ist eine Fortsetzung einer laufenden Serie, die darauf abzielt, das autonome Spielen zu perfektionieren und Levels ohne menschliches Eingreifen zu meistern. Der Schwerpunkt liegt auf der Verwendung eines mutationsbasierten Eingabegenerators, der Bits in Eingabedaten umkehrt, um unterschiedliche Szenarien zu erstellen, die die Reaktion des Spiels testen und Randfälle offenbaren, die bei herkömmlichen Tests möglicherweise unbemerkt bleiben.

Hier ist ein Code-Ausschnitt aus der Methodik:

import mario
import random

def generate_input(starting_byte, flip_probability, input_length): input = [] next_byte = starting_byte for _ in range(input_length): for j in range(8): if random.random() < flip_probability: next_byte ^= (1 << j) input.append(next_byte) return input

Dieser Ansatz ist darauf ausgelegt, ein realistisches Gameplay zu simulieren, wobei bestimmte Tasten über mehrere Frames gedrückt bleiben, ähnlich wie Spieler die Taste 'nach rechts bewegen' halten, während sie 'springen' tippen. Eine Sammlung von Pfaden, dargestellt durch Eingabesequenzen, wird beibehalten und selektiv wiedergegeben, um einen optimalen Kurs durch das Spiel zu finden. Eine einfache Fitnessfunktion bevorzugt Pfade mit der höchsten x-Achsen-Position, aber aufgrund möglicher Sackgassen wird ein diverser Satz von Pfaden mit unterschiedlichen Punktzahlen erkundet, um umfassendes Testen zu gewährleisten.

Ad

Diese Technik ist besonders nützlich für Entwickler, die an der Spieleentwicklung beteiligt sind, oder für diejenigen, die sich für Testautomatisierung interessieren, da sie Einblicke in die effiziente Erkundung komplexer Zustandsräume bietet.

📖 Lesen Sie die vollständige Quelle: HN AI Agents

Ad

👀 Siehe auch

Entwickler baut vollständiges ERP-System mit KI-Assistent unter Verwendung von Claude und Gemini
Anwendungsfälle

Entwickler baut vollständiges ERP-System mit KI-Assistent unter Verwendung von Claude und Gemini

Ein Entwickler hat eine vollständige ERP-Plattform namens AXIO mit 9 Modulen und einem KI-Assistenten erstellt, der Sprachbefehle mithilfe von Gemini 2.5 Flash mit 16 Funktionsaufruf-Tools ausführt. Das System wurde in 3 Wochen mit Next.js 14, TypeScript und Supabase durch 'Vibe-Coding' mit Claude entwickelt.

OpenClawRadar
Verwalten von Kontextgrenzen bei langen Claude-Läufen: AC-Baum-Muster
Anwendungsfälle

Verwalten von Kontextgrenzen bei langen Claude-Läufen: AC-Baum-Muster

Ein Entwickler teilt ein Fehlermuster bei langen Claude-Läufen, bei dem Auto-Kompakt zu Informationsverlust führt und Kontextlimits eine Fortsetzung verhindern, und beschreibt dann eine Lösung mithilfe eines AC-Baum-Abhängigkeitsgraphen mit isolierten Sitzungen pro Knoten.

OpenClawRadar
Patient nutzt Claude AI, um medizinische Daten zu interpretieren und die Behandlung von Gehirntumor zu steuern.
Anwendungsfälle

Patient nutzt Claude AI, um medizinische Daten zu interpretieren und die Behandlung von Gehirntumor zu steuern.

Ein 27-jähriger Patient mit primärem mediastinalem B-Zell-Lymphom mit ZNS-Beteiligung nutzt Claude AI täglich, um Immunhistochemie-Panels zu interpretieren, PET-CT-Scan-Ergebnisse zu analysieren, CAR-T-Studiendaten auszuwerten, Medikamentenmechanismen zu verstehen und Fragen für das medizinische Team vorzubereiten.

OpenClawRadar
Erstellen einer 200.000-Zeilen-Produktions-App per Vibe Coding von einem Telefon aus
Anwendungsfälle

Erstellen einer 200.000-Zeilen-Produktions-App per Vibe Coding von einem Telefon aus

Ein Entwickler hat Vibe Remote erstellt, ein mobiles Vibe-Coding-Tool mit etwa 200.000 Codezeilen (140k Go, 60k Swift), hauptsächlich durch das Senden von Nachrichten an Claude Code über die App vom Handy aus. Das Projekt offenbarte wichtige Herausforderungen wie DRY-Verstöße und Engpässe bei E2E-Tests.

OpenClawRadar