Descompilação Assistida por LLM: De 25% a 75% no Snowboard Kids 2

O artigo discute os desafios e estratégias na descompilação assistida por LLM, particularmente usando Claude para descompilar jogos de Nintendo 64 como Snowboard Kids 2. Inicialmente, o progresso envolvia descompilação de uma só vez, aumentando o código correspondente de cerca de 25% para 58%. No entanto, o progresso desacelerou, exigindo uma mudança de abordagem para eventualmente atingir ~75% das funções correspondentes.

Uma estratégia crítica envolveu priorizar quais funções não correspondentes abordar, inicialmente usando um modelo de regressão logística para estimar a dificuldade com base em características como contagem de instruções e complexidade do fluxo de controle. Quando essa abordagem estagnou, explorar a similaridade de funções através de embeddings de texto das instruções de assembly mostrou-se frutífero. Isso envolveu calcular funções correspondentes semelhantes para fornecer referências úteis, melhorando assim o desempenho da descompilação do Claude.

Para calcular a similaridade, foram discutidos embeddings vetoriais, que são frequentemente usados em sistemas RAG para recuperação rápida. No entanto, para um projeto com apenas alguns milhares de candidatos, o cálculo preciso de similaridade era viável. Uma pontuação de similaridade composta considerando n-gramas normalizados de instruções, padrões de fluxo de controle, deslocamentos de acesso à memória e métricas estruturais foi inicialmente usada, mas posteriormente, o método mais simples do Coddog de calcular a distância de Levenshtein limitada sobre sequências de opcodes mostrou-se igualmente eficaz, reduzindo a complexidade.

Ferramentas especializadas como gfxdis.f3dex2 e decomp-permuter também melhoraram o desempenho do Claude. Especificamente, o uso da biblioteca F3Dex2 tornou o gerenciamento do microcódigo do Reality Display Processor (RDP) do N64 mais manejável, evitando a necessidade de engenharia reversa personalizada.

📖 Leia a fonte completa: HN LLM Tools

Descompilação Assistida por LLM: Evolução de Estratégias e Ferramentas

👀 See Also

OpenClaw + SalesBlink: Gestão Autônoma de Alcance Reduz Tempo de 10h para 1h/semana

Consultoria em Design de Edifícios Substitui Wix por Agente de IA de Ponta

Loop Autônomo Claude Code Executa GymCoach Open-Source 24/7 — Triagem, Codificação, Merge

Configuração do Claude Code com múltiplos painéis, separação de funções e ganchos de execução