행동 모델을 활용한 슈퍼 마리오 자율 테스트

✍️ OpenClawRadar📅 게시일: February 20, 2026🔗 Source
행동 모델을 활용한 슈퍼 마리오 자율 테스트
Ad

이 글은 슈퍼 마리오 브라더스에서 활용되는 자율 테스팅 방법을 탐구하며, 행동 모델 접근법을 사용합니다. 이는 인간의 개입 없이 자율 플레이와 레벨 클리어를 완성하기 위한 진행 중인 시리즈의 후속편입니다. 핵심 초점은 입력 데이터의 비트를 뒤집어 게임의 반응을 테스트하기 위한 다양한 시나리오를 생성하는 돌연변이 기반 입력 생성기를 사용하는 것으로, 전통적인 테스팅을 통해 놓칠 수 있는 엣지 상황을 드러냅니다.

방법론의 코드 스니펫입니다:

import mario
import random

def generate_input(starting_byte, flip_probability, input_length): input = [] next_byte = starting_byte for _ in range(input_length): for j in range(8): if random.random() < flip_probability: next_byte ^= (1 << j) input.append(next_byte) return input

이 접근법은 현실적인 게임 플레이를 모방하도록 설계되어, 플레이어가 '점프'를 누르는 동안 '오른쪽 이동'을 누르고 있는 것처럼 특정 키를 여러 프레임 동안 계속 누르도록 합니다. 입력 시퀀스로 표현되는 경로 모음을 유지하고 선택적으로 재생하여 게임을 통과하는 최적의 경로를 찾습니다. 간단한 적합도 함수는 가장 높은 x축 위치를 가진 경로를 선호하지만, 잠재적인 막다른 길로 인해 다양한 점수를 가진 경로 세트를 탐색하여 포괄적인 테스팅을 보장합니다.

이 기술은 게임 개발에 참여하는 개발자나 테스팅 자동화에 관심 있는 사람들에게 특히 유용하며, 복잡한 상태 공간의 효율적인 탐색에 대한 통찰력을 제공합니다.

📖 전체 출처 읽기: HN AI Agents

Ad

👀 See Also

DOM 최적화 및 대시보드 모니터링을 통한 OpenClaw 에이전트 비용 최적화
Use Cases

DOM 최적화 및 대시보드 모니터링을 통한 OpenClaw 에이전트 비용 최적화

DOM 읽기를 위한 맞춤형 JavaScript 평가를 사용하여 API 호출과 토큰 부풀림을 최소화하며 OpenClaw 에이전트 비용을 41% 절감했습니다. 실시간 토큰 대시보드는 사용량 추적을 지원합니다.

OpenClawRadar
Drivesidekick 구축: Claude Code를 활용한 운전 앱
Use Cases

Drivesidekick 구축: Claude Code를 활용한 운전 앱

개발자들이 프론트엔드 전문 지식 없이 Claude Code를 사용해 모바일 앱을 구축하고 있습니다. 백엔드 개발자가 Claude Code를 활용해 React Native/Expo를 사용한 운전 교육 앱인 Drivesidekick을 만들었습니다.

OpenClawRadar
화물 운전사, Claude 코드로 iOS 앱 개발하고 실용적인 교훈 공유
Use Cases

화물 운전사, Claude 코드로 iOS 앱 개발하고 실용적인 교훈 공유

최소한의 코딩 경험만 있는 일본의 화물 운전사가 Claude Code를 사용하여 새로운 기록 보관 규정을 위한 iOS 앱을 구축하고 6개월 만에 앱 스토어에 출시했습니다. 그는 프롬프트 엔지니어링, Expo와 Supabase의 예상치 못한 비용, 번아웃 관리에 대한 구체적인 교훈을 공유합니다.

OpenClawRadar
오래가는 OpenClaw 설정: 복잡성 줄이고 신뢰성 높이기
Use Cases

오래가는 OpenClaw 설정: 복잡성 줄이고 신뢰성 높이기

40-50개의 OpenClaw 설정 분석 결과, 지속 가능한 구성은 1개의 에이전트, 3-5개의 스킬, Sonnet 모델을 사용하며 캘린더 관리 및 이메일 분류와 같은 일상적인 작업에 집중하는 반면, 20개 이상의 스킬을 가진 복잡한 다중 에이전트 시스템은 일반적으로 3주 이내에 실패합니다.

OpenClawRadar