LLM Descompilación: Del 25% al 75% en Snowboard Kids 2

El artículo discute los desafíos y estrategias en la descompilación asistida por LLM, particularmente utilizando Claude para descompilar juegos de Nintendo 64 como Snowboard Kids 2. Inicialmente, el progreso involucró una descompilación de un solo intento, aumentando el código coincidente de alrededor del 25% al 58%. Sin embargo, el progreso se desaceleró, lo que exigió un cambio de enfoque para finalmente alcanzar aproximadamente el 75% de funciones coincidentes.

Una estrategia crítica implicó priorizar qué funciones no coincidentes abordar, inicialmente utilizando un modelo de regresión logística para estimar la dificultad en función de características como el conteo de instrucciones y la complejidad del control de flujo. Cuando este enfoque llegó a un punto muerto, explorar la similitud de funciones a través de embebidos de texto de instrucciones de ensamblador resultó fructífero. Esto involucró el cálculo de funciones coincidentes similares para proporcionar referencias útiles, mejorando así el rendimiento de descompilación de Claude.

Para calcular la similitud, se discutieron los embebidos vectoriales, que a menudo se utilizan en sistemas RAG para una rápida recuperación. Sin embargo, para un proyecto con solo unos pocos miles de candidatos, el cálculo de similitud preciso era factible. Se utilizó inicialmente un puntaje de similitud compuesto que tenía en cuenta n-gramas de instrucción normalizados, patrones de control de flujo, desplazamientos de acceso a memoria y métricas estructurales, pero luego, el método más simple de Coddog para calcular la distancia de Levenshtein acotada sobre secuencias de opcode resultó igual de efectivo, reduciendo la complejidad.

Herramientas especializadas como gfxdis.f3dex2 y decomp-permuter también mejoraron el rendimiento de Claude. En particular, el uso de la biblioteca F3Dex2 hizo que el manejo del microcódigo del Procesador de Pantalla de Realidad (RDP) de la N64 fuera más manejable, evitando la necesidad de ingeniería inversa personalizada.

📖 Lee la fuente completa: HN LLM Tools

Descompilación Asistida por LLM: Estrategias y Herramientas en Evolución

👀 Ver también

Desafíos y Lecciones del Desarrollo de un Sistema de Comercio con ML usando Claude

Construyendo un Sistema de Agente de IA Autónomo con Claude Code: Un Estudio de Caso

Desarrollador crea aplicación bancaria para macOS con Claude Code en 6 semanas.

Agencia: Un Mercado de Habilidades.md Construido con Claude en 3 Semanas