Localisation de grands dépôts de code avec LLM : flux de travail d'un développeur pour 4 500 clés d'interface utilisateur

Un développeur a documenté son processus de localisation d'un projet de jeu de grande envergure avec environ 4 500 clés d'interface utilisateur stockées dans un fichier en-US.json de 500 Ko. Il a utilisé un flux de travail LLM en plusieurs étapes pour gérer l'extraction, la traduction et l'amélioration de la qualité.
Tentatives initiales d'extraction et de traduction
D'abord, il a utilisé Claude pour scanner sa base de code, extraire les chaînes d'interface utilisateur codées en dur et les migrer vers les normes i18n, créant ainsi le fichier de localisation. Pour la traduction en italien, il a d'abord essayé Claude et Gemini Pro (via Gemini CLI et Antigravity). Les deux modèles cloud ont produit des traductions de qualité inacceptable. Gemini Pro a également rencontré des erreurs avec le fichier volumineux, nécessitant de le diviser en 10 morceaux plus petits.
Passage aux modèles locaux et la percée contextuelle
Il a ensuite essayé TranslateGemma localement via LM Studio, traduisant clé par clé. Bien que légèrement meilleure, la qualité n'était toujours pas acceptable. L'idée clé était que les mots d'interface utilisateur sont souvent ambigus, et que la traduction nécessite une désambiguïsation et un contexte d'utilisation.
Pour résoudre cela, il est retourné à Claude pour générer un deuxième fichier. Pour chacune des 4 500 clés, Claude a inspecté l'utilisation du code pour fournir un contexte : où la chaîne apparaît, sa fonction (étiquette de bouton, description, indication de saisie) et son effet dans le gameplay.
Le pipeline de traduction final
Il a construit un pipeline de traduction automatisé avec les étapes suivantes :
- Regrouper les clés par lots avec leur contexte généré.
- Utiliser une invite axée sur la traduction fonctionnelle (et non littérale).
- Appliquer la préservation des espaces réservés et des balises.
- Envoyer les requêtes à un modèle local via LM Studio.
TranslateGemma ne pouvait pas gérer le format d'invite riche en contexte, il a donc changé de modèle. Il a testé sur un Mac Mini M1 avec 16 Go de mémoire unifiée.
Performance des modèles et résultats
Qwen 3 4B a bien performé, mais Qwen 3 8B était le point idéal, produisant moins d'erreurs de grammaire et de meilleures formulations tout en restant gérable à exécuter localement. Le pipeline final peut traduire les 4 500+ clés dans plusieurs langues, prenant environ 8 heures par langue sur sa machine. Il utilise un modèle quantifié pour pouvoir continuer à travailler pendant qu'il s'exécute en arrière-plan.
Le développeur note que cette approche a produit une qualité suffisamment bonne pour être livrée et semblait meilleure que de nombreux projets auto-traduits qu'il a vus.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Flux vocal quotidien de 3,5 heures avec Claude : dictez les spécifications en marchant, construisez avec Claude Code
Un développeur promène 3 chiens 12+ fois par jour (3,5 heures) et utilise la voix + Claude pour réfléchir, rechercher et produire des fichiers spec.md. Ensuite, Claude Code construit à partir de ces spécifications.

Développeur Utilise le Code Claude pour Construire une Clé USB qui Lance Automatiquement le Jeu Chrome Dino
Un développeur a créé une clé USB à l'aide d'une carte ATtiny85 qui joue automatiquement au jeu Dino de Chrome en détectant les obstacles avec des capteurs de lumière et en envoyant des commandes clavier. Claude Code a aidé au développement du firmware, y compris l'intégration V-USB, la logique des capteurs et les algorithmes de temporisation adaptative.

Construction de couches de données verticales pour les agents OpenClaw
La véritable opportunité avec OpenClaw n'est pas seulement de l'utiliser, mais de construire des couches de données spécifiques à l'industrie qui connectent des sources de données désordonnées, les normalisent en schémas utilisables et les exposent comme des points d'accès d'outils propres qui renvoient du JSON structuré.

Les utilisateurs de Claude expérimentent la communication entre IA pour des conversations difficiles.
Deux utilisateurs de Claude ont testé la communication directe entre leurs assistants IA sur des sujets sensibles comme les problèmes relationnels, chaque personne examinant les messages avant envoi. L'expérience a permis de faire émerger des sentiments non exprimés et a servi de couche de traduction pour les conversations difficiles.