Автономное тестирование Super Mario с использованием моделей поведения

✍️ OpenClawRadar📅 Опубликовано: 20 февраля 2026 г.🔗 Source
Автономное тестирование Super Mario с использованием моделей поведения
Ad

Статья углубляется в методы автономного тестирования, используемые в Super Mario Bros., применяя подход с моделью поведения. Это продолжение текущей серии, направленной на совершенствование автономной игры и прохождение уровней без человеческого вмешательства. Основное внимание уделяется использованию генератора ввода на основе мутаций, который изменяет биты во входных данных, создавая разнообразные сценарии для тестирования реакции игры, выявляя крайние ситуации, которые могут оставаться незамеченными при традиционном тестировании.

Вот фрагмент кода из методологии:

import mario
import random

def generate_input(starting_byte, flip_probability, input_length): input = [] next_byte = starting_byte for _ in range(input_length): for j in range(8): if random.random() < flip_probability: next_byte ^= (1 << j) input.append(next_byte) return input

Этот подход разработан для имитации реалистичного игрового процесса, позволяя определенным клавишам оставаться нажатым на протяжении нескольких кадров, подобно тому, как игроки удерживают 'движение вправо', нажимая 'прыжок'. Поддерживается коллекция путей, представленных последовательностями ввода, которые затем выборочно воспроизводятся для нахождения оптимального маршрута через игру. Простая функция приспособленности отдает предпочтение путям с наибольшей позицией по оси X, но из-за потенциальных тупиков исследуется разнообразный набор путей с различными оценками, чтобы обеспечить всестороннее тестирование.

Ad

Эта техника особенно полезна для разработчиков, участвующих в разработке игр, или для тех, кто интересуется автоматизацией тестирования, предоставляя insights для эффективного исследования сложных пространств состояний.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

Финансовый моделист создает локальное настольное приложение "Речь в инструмент" с помощью Claude Code
Кейсы

Финансовый моделист создает локальное настольное приложение "Речь в инструмент" с помощью Claude Code

Разработчик с опытом финансового моделирования использовал Claude Code для создания Sotto — локального приложения для преобразования речи в текст на Windows, которое запускает Whisper на GPU. Приложение имеет системные горячие клавиши, автоматическое определение остановки речи и интерфейс на Qt, состоящий примерно из 2200 строк Python-кода в 17 файлах.

OpenClawRadar
Демонстрация голосового вызова агента OpenClaw с потоковым синтезом речи (TTS) и функцией перебивания (Barge-in)
Кейсы

Демонстрация голосового вызова агента OpenClaw с потоковым синтезом речи (TTS) и функцией перебивания (Barge-in)

Разработчик продемонстрировал своего агента OpenClaw, совершающего телефонные звонки через Telegram, с потоковым преобразованием текста в речь, которое реагирует предложение за предложением и поддерживает возможность перебивания для естественных разговоров.

OpenClawRadar
Партнерская программа Claude: консалтинг из двух человек решает задачу для десяти с помощью сертифицированных независимых специалистов
Кейсы

Партнерская программа Claude: консалтинг из двух человек решает задачу для десяти с помощью сертифицированных независимых специалистов

Консалтинговая компания в сфере ИИ из двух человек использовала Claude, чтобы попасть в партнёрскую программу Anthropic, а затем привлекла сертифицированных независимых специалистов для соблюдения требования о 10 сотрудниках.

OpenClawRadar
Разработчик-одиночка создает нативное iOS-приложение для терапии на Swift с помощью Claude Opus 4.6 для кодинга, отладки и архитектуры
Кейсы

Разработчик-одиночка создает нативное iOS-приложение для терапии на Swift с помощью Claude Opus 4.6 для кодинга, отладки и архитектуры

Разработчик-одиночка создал Prelude — бесплатное автономное приложение для подготовки к терапии на iOS, используя Claude Opus 4.6. ИИ занимался генерацией кода, отладкой голосового агента и проектированием конвейера ИИ на устройстве.

OpenClawRadar