Recommandations de modèles de traduction locale pour les cartes graphiques avec 32 Go de VRAM

✍️ OpenClawRadar📅 Publié: March 26, 2026🔗 Source
Recommandations de modèles de traduction locale pour les cartes graphiques avec 32 Go de VRAM
Ad

Un développeur avec une configuration GPU VRAM de 32 Go (mentionnant spécifiquement un 5090) a partagé des résultats pratiques sur les modèles de traduction locaux optimisés pour le sous-titrage en temps réel et la traduction de mots/phrases. Ses paires de langues principales sont le suédois-anglais et le coréen-anglais.

Modèles Recommandés

Sur la base des tests de qualité et de vitesse :

  • Pour les langues en général : Unsloth Gemma3 27b Instruct UD, Q6_K_XL
  • Pour les langues européennes + 11 incluses (dont le coréen) : Bartowski Utter Project EuroLLM 22B Instruct 2512, Q8_0

Le développeur a noté que ces modèles surpassaient les précédents modèles de référence : Magistral Small 2509 Q8, Gemma 3 27b Q4, Mistral Small 3.2 Q6_K, et GPT_OSS 20b (dans cet ordre).

Notes sur les Performances

Avec ces modèles, il a obtenu :

  • Des traductions de sous-titres avec peu ou pas de mise en mémoire tampon
  • Des traductions de recherche de mots en 0 à 2 secondes

Modèles Trop Lents

  • Qwen3.5 27b Q6
  • HyperCLOVAX SEED Think 32B Q6 (pour le coréen)
  • Qwen3 32b Q6 (parmi d'autres variantes Qwen3-3.5)
  • Viking 33b I1 Q4_K_S
Ad

Autres Observations

Le développeur a mentionné les modèles TranslateGemma, qu'il décrit comme "bien meilleurs selon Google que Gemma3 27b pour la traduction", mais a noté qu'ils utilisent des invites utilisateur-utilisateur plutôt que le format système-utilisateur. Il ne les a pas essayés personnellement en raison de cette différence de format.

Pour la traduction suédoise spécifiquement, GPT SW3 20b a été noté comme "bon quand il fonctionne, ce qui est rare (il refuse d'accepter mon invite système)".

Le développeur a également mentionné être passé aux versions d'essai Gemini 2.5 Flash et Gemini 2.5 Flash-lite non pas parce que les traductions locales étaient mauvaises, mais parce qu'il "remarquait encore quelques erreurs". Il hésite entre Deepseek, OpenAI, Gemini, z.AI et Claude pour des traductions peu coûteuses, avec ChatGPT Thinking comme référence de qualité.

Il a noté quelques options de clés API gratuites via : NVIDIA NIM, Routeway, Kilo, OpenCode et Puter.js, bien qu'il ne les ait pas essayées. Il a testé l'API GLM-4.7-Flash directement depuis z.ai, la trouvant "assez bonne, au niveau de Gemma 3 27b voire meilleure", mais a atteint les limites de taux lors de recherches de mots en plus des traductions de sous-titres.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Migration des agents OpenClaw vers Claude Code après la dépréciation du harnais tiers
Guides

Migration des agents OpenClaw vers Claude Code après la dépréciation du harnais tiers

Un développeur a migré 17 agents OpenClaw vers Claude Code en un après-midi après qu'Anthropic ait mis fin au support des harnais tiers. Le processus a impliqué la création de points d'entrée CLAUDE.md, d'enveloppes bash et de tâches cron tout en préservant la logique existante des agents.

OpenClawRadar
5 capacités principales d'OpenClaw disponibles sans installation de compétences
Guides

5 capacités principales d'OpenClaw disponibles sans installation de compétences

L'installation de base d'OpenClaw peut gérer les opérations sur fichiers, les commandes shell, la récupération web, les tâches planifiées et les flux de travail en plusieurs étapes sans compétences supplémentaires, réduisant ainsi les coûts en tokens et la complexité de configuration.

OpenClawRadar
Test de Contrat pour le Développement Piloté par l'IA avec OpenClaw
Guides

Test de Contrat pour le Développement Piloté par l'IA avec OpenClaw

Les tests de contrat peuvent remplacer les tests d'intégration/E2E lors de l'utilisation d'agents IA comme OpenClaw, en se concentrant sur les interfaces et les invariants entre les composants. L'IA génère du code pour satisfaire des contrats déterministes, créant une boucle de rétroaction serrée pour une itération plus rapide.

OpenClawRadar
12 modèles OpenClaw SOUL.md et STYLE.md avec des leçons pratiques
Guides

12 modèles OpenClaw SOUL.md et STYLE.md avec des leçons pratiques

Un développeur a créé 12 modèles d'agents OpenClaw pour des cas d'usage courants, chacun suivant la spécification officielle en 4 sections, et a identifié des leçons clés, notamment la nécessité d'un fichier STYLE.md pour définir les modes de communication et l'importance de limites spécifiques plutôt que de traits de personnalité vagues.

OpenClawRadar