Рекомендации по локальным моделям перевода для видеокарт с 32 ГБ VRAM

Разработчик с конфигурацией GPU на 32 ГБ видеопамяти (конкретно упоминая 5090) поделился практическими результатами по локальным моделям перевода, оптимизированным для перевода субтитров в реальном времени и слов/фраз. Его основные языковые пары — шведский-английский и корейский-английский.
Рекомендуемые модели
На основе тестирования качества и скорости:
- Для большинства языков: Unsloth Gemma3 27b Instruct UD, Q6_K_XL
- Для европейских языков + 11 включённых (включая корейский): Bartowski Utter Project EuroLLM 22B Instruct 2512, Q8_0
Разработчик отметил, что эти модели превзошли предыдущие популярные модели: Magistral Small 2509 Q8, Gemma 3 27b Q4, Mistral Small 3.2 Q6_K и GPT_OSS 20b (в таком порядке).
Заметки о производительности
С этими моделями он достиг:
- Перевод субтитров с минимальной или нулевой буферизацией
- Перевод отдельных слов за 0-2 секунды
Модели, которые оказались слишком медленными
- Qwen3.5 27b Q6
- HyperCLOVAX SEED Think 32B Q6 (для корейского)
- Qwen3 32b Q6 (среди других вариантов Qwen3-3.5)
- Viking 33b I1 Q4_K_S
Другие наблюдения
Разработчик упомянул модели TranslateGemma, которые, по его словам, «значительно лучше, согласно Google, чем Gemma3 27b в переводе», но отметил, что они используют формат пользователь-пользователь, а не система-пользователь. Он не пробовал их лично из-за этого различия в формате.
Для перевода с шведского конкретно GPT SW3 20b была отмечена как «хорошая, когда работает, что бывает редко (отказывается принимать мой системный промпт)».
Разработчик также упомянул переход на пробные версии Gemini 2.5 Flash и Gemini 2.5 Flash-lite не потому, что локальный перевод был плох, а потому что он «всё ещё замечал некоторые ошибки». Он выбирает между Deepseek, OpenAI, Gemini, z.AI и Claude для дешёвого перевода, используя ChatGPT Thinking как эталон качества.
Он отметил некоторые бесплатные варианты API-ключей через: NVIDIA NIM, Routeway, Kilo, OpenCode и Puter.js, хотя сам их не пробовал. Он тестировал GLM-4.7-Flash API напрямую от z.ai, найдя его «довольно хорошим, примерно на уровне Gemma 3 27b или даже лучше», но столкнулся с ограничениями по частоте запросов при поиске слов поверх перевода субтитров.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

OpenClaw 2026.3.7 ломает вызовы инструментов Kimi, откат до версии 2026.3.2 исправляет регрессию.
В версии OpenClaw 2026.3.7 обнаружена регрессия, при которой провайдер Kimi API выводит сырой XML <function_calls> вместо выполнения инструментов. Решение — откатиться до версии 2026.3.2 и восстановить совместимый конфигурационный файл.

Создание пользовательских навыков для Claude Co-Work: лучшие практики и форматы
Изучите лучшие практики создания пользовательских навыков для Claude Co-Work с конкретными советами по форматированию и реализации, основанными на опыте пользователей.

Запуск OpenClaw, ClawdBot и MoltBot с ограниченным бюджетом
Узнайте, как запускать OpenClaw, ClawdBot и MoltBot, не разоряя себя. Ознакомьтесь с советами по бюджету и бесплатными альтернативами, о которых говорили энтузиасты на r/clawdbot.

Создание API-эндпоинтов с помощью Claude: Практические уроки по инженерии промптов из проекта с 70+ эндпоинтами
Разработчик создал более 70 API-эндпоинтов для автоматизации LinkedIn, используя Claude для написания 80% кода, обнаружив, что подход к промптам как к контрактам с явными ограничениями работает лучше, чем инструкции на естественном языке для агентов, выполняющих действия.