Descompilação Assistida por LLM: Evolução de Estratégias e Ferramentas

O artigo discute os desafios e estratégias na descompilação assistida por LLM, particularmente usando Claude para descompilar jogos de Nintendo 64 como Snowboard Kids 2. Inicialmente, o progresso envolvia descompilação de uma só vez, aumentando o código correspondente de cerca de 25% para 58%. No entanto, o progresso desacelerou, exigindo uma mudança de abordagem para eventualmente atingir ~75% das funções correspondentes.
Uma estratégia crítica envolveu priorizar quais funções não correspondentes abordar, inicialmente usando um modelo de regressão logística para estimar a dificuldade com base em características como contagem de instruções e complexidade do fluxo de controle. Quando essa abordagem estagnou, explorar a similaridade de funções através de embeddings de texto das instruções de assembly mostrou-se frutífero. Isso envolveu calcular funções correspondentes semelhantes para fornecer referências úteis, melhorando assim o desempenho da descompilação do Claude.
Para calcular a similaridade, foram discutidos embeddings vetoriais, que são frequentemente usados em sistemas RAG para recuperação rápida. No entanto, para um projeto com apenas alguns milhares de candidatos, o cálculo preciso de similaridade era viável. Uma pontuação de similaridade composta considerando n-gramas normalizados de instruções, padrões de fluxo de controle, deslocamentos de acesso à memória e métricas estruturais foi inicialmente usada, mas posteriormente, o método mais simples do Coddog de calcular a distância de Levenshtein limitada sobre sequências de opcodes mostrou-se igualmente eficaz, reduzindo a complexidade.
Ferramentas especializadas como gfxdis.f3dex2 e decomp-permuter também melhoraram o desempenho do Claude. Especificamente, o uso da biblioteca F3Dex2 tornou o gerenciamento do microcódigo do Reality Display Processor (RDP) do N64 mais manejável, evitando a necessidade de engenharia reversa personalizada.
📖 Leia a fonte completa: HN LLM Tools
👀 See Also

Hospedagem na Nuvem com Um Clique para Agentes de IA OpenClaw
A OpenClaw revela uma solução revolucionária de hospedagem em nuvem com um clique para agentes de IA, simplificando a implantação e a acessibilidade. Descubra como essa inovação está pronta para transformar o desenvolvimento de IA na plataforma OpenClaw.

Configurando Múltiplos Agentes de Codificação de IA com OpenClaw: Configuração de Provedor Personalizado e Desafios de Memória Entre Agentes
Este post detalha a configuração do OpenClaw com um provedor de API de terceiros (DeepInfra) para executar múltiplos agentes de codificação (backend, frontend, migrações) sem atingir limites de taxa, e o problema de isolamento de memória entre agentes que surgiu.

Otimização de Custos do OpenClaw: Como um Desenvolvedor Corrigiu um Erro de US$ 750 com Roteamento de Modelos
Um desenvolvedor compartilha como trocar todos os subagentes do OpenClaw para o modelo gratuito Hunter Alpha no OpenRouter levou a falhas silenciosas, incluindo um agente de produção de vídeo que gerou código válido, mas produziu um vídeo preto e silencioso de 9 segundos. A solução envolveu implementar roteamento explícito de modelos com base nos requisitos da tarefa.

Configuração de codificação de emergência: Claude Code em VM gratuita da OCI com Termux no Android
Um desenvolvedor compartilha uma configuração usando a VM gratuita da Oracle Cloud Infrastructure (24GB de RAM, 4 vCPUs) com o Claude Code instalado, acessado via Termux no Android para programação de emergência quando um laptop não está disponível. A configuração requer assinatura do Claude Pro (US$ 20/mês) ou Max (US$ 100/mês).