Localización de Grandes Bases de Código con LLMs: Un Flujo de Trabajo para Desarrolladores con 4,500 Claves de Interfaz de Usuario

Un desarrollador documentó su proceso para localizar un proyecto de juego grande con aproximadamente 4.500 claves de interfaz almacenadas en un archivo en-US.json de 500KB. Usó un flujo de trabajo de LLM de múltiples pasos para manejar extracción, traducción y mejora de calidad.
Intentos Iniciales de Extracción y Traducción
Primero, usó Claude para escanear su base de código, extraer cadenas de interfaz codificadas directamente, y migrarlas a estándares i18n, creando el archivo de localización. Para la traducción al italiano, inicialmente probaron Claude y Gemini Pro (vía Gemini CLI y Antigravity). Ambos modelos en la nube produjeron traducciones de calidad inaceptable. Gemini Pro también encontró errores con el archivo grande, requiriendo dividirlo en 10 fragmentos más pequeños.
Cambiando a Modelos Locales y el Avance del Contexto
Luego probaron TranslateGemma localmente vía LM Studio, traduciendo clave por clave. Aunque ligeramente mejor, la calidad aún no era aceptable. La idea clave fue que las palabras de interfaz son a menudo ambiguas, y la traducción requiere desambiguación y contexto de uso.
Para resolver esto, volvieron a Claude para generar un segundo archivo. Para cada una de las 4.500 claves, Claude inspeccionó el uso en el código para proporcionar contexto: dónde aparece la cadena, su función (etiqueta de botón, descripción, sugerencia de entrada), y su efecto en la jugabilidad.
La Tubería de Traducción Final
Construyeron una tubería de traducción automatizada con los siguientes pasos:
- Agrupar claves junto con su contexto generado.
- Usar una indicación enfocada en traducción funcional (no literal).
- Forzar la preservación de marcadores de posición y etiquetas.
- Enviar solicitudes a un modelo local a través de LM Studio.
TranslateGemma no pudo manejar el formato de indicación con mucho contexto, así que cambiaron de modelo. Probaron en una Mac Mini M1 con 16GB de memoria unificada.
Rendimiento del Modelo y Resultados
Qwen 3 4B funcionó bien, pero Qwen 3 8B fue el punto óptimo, produciendo menos errores gramaticales y mejor redacción mientras seguía siendo manejable para ejecutar localmente. La tubería final puede traducir las más de 4.500 claves a múltiples idiomas, tomando aproximadamente 8 horas por localización en su máquina. Usan un modelo cuantizado para poder seguir trabajando mientras se ejecuta en segundo plano.
El desarrollador señala que este enfoque produjo calidad suficiente para enviar y se sintió mejor que muchos proyectos traducidos automáticamente que han visto.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

OpenClaw ejecutándose como administrador completo del sistema en Linux con LLM local
Un usuario ejecuta OpenClaw como administrador completo de sistemas en servidores Linux, utilizando Qwen 3.6 27b q6 de forma local sin conexión externa a internet excepto Tailscale, e informa que manejó de forma autónoma el despliegue del modo quiosco.

Análisis del Antropomorfismo en Claude Pokemon Chat Utilizando Modelos Bayesianos
Un investigador analizó mensajes del chat de Twitch del benchmark de Pokémon de Claude para estudiar cómo los usuarios antropomorfizan la IA, utilizando modelos mixtos bayesianos en 107k mensajes anotados por Gemini 2.0 Flash. Las etiquetas de falsa creencia fueron predictores fuertes de antropomorfización, aumentando la probabilidad de ~11% a ~45%.

Desarrollador Crea Aplicación de Finanzas Personales en un Mes Usando Claude Code: Flujos de Trabajo Clave y Desafíos
Un desarrollador con 14 años de experiencia creó y lanzó una aplicación de pronóstico financiero personal a la App Store en aproximadamente un mes usando Claude Code. Identificó tres flujos de trabajo específicos donde Claude Code fue más efectivo y compartió desafíos con la expansión del alcance y la complejidad del modelo de datos.

Monitor de Conflictos en Tiempo Real Desarrollado con la API de Claude Analiza el Impacto de las Noticias
Un desarrollador utilizó la API de Claude para construir una canalización automatizada que lee noticias sobre conflictos de más de 100 fuentes, las clasifica por tema/país/gravedad, genera puntuaciones de impacto (1-100) y produce resúmenes inteligentes de 3 líneas.