Lokale Übersetzungsmodell-Empfehlungen für GPUs mit 32 GB VRAM

Ein Entwickler mit einem 32GB-VRAM-GPU-Setup (erwähnte speziell eine 5090) teilte praktische Erkenntnisse über lokale Übersetzungsmodelle, die für Echtzeit-Untertitel- und Wort-/Phrasenübersetzungen optimiert sind. Seine Hauptsprachpaare sind Schwedisch-Englisch und Koreanisch-Englisch.
Empfohlene Modelle
Basierend auf Tests zu Qualität und Geschwindigkeit:
- Für allgemeine Sprachen: Unsloth Gemma3 27b Instruct UD, Q6_K_XL
- Für europäische Sprachen + 11 enthaltene (darunter Koreanisch): Bartowski Utter Project EuroLLM 22B Instruct 2512, Q8_0
Der Entwickler stellte fest, dass diese frühere Standardmodelle übertrafen: Magistral Small 2509 Q8, Gemma 3 27b Q4, Mistral Small 3.2 Q6_K und GPT_OSS 20b (in dieser Reihenfolge).
Leistungshinweise
Mit diesen Modellen erreichte er:
- Untertitelübersetzungen mit wenig bis keiner Pufferung
- Wortnachschlagübersetzungen innerhalb von 0-2 Sekunden
Modelle, die zu langsam waren
- Qwen3.5 27b Q6
- HyperCLOVAX SEED Think 32B Q6 (für Koreanisch)
- Qwen3 32b Q6 (unter anderen Qwen3-3.5-Varianten)
- Viking 33b I1 Q4_K_S
Weitere Beobachtungen
Der Entwickler erwähnte TranslateGemma-Modelle, von denen er berichtet, sie seien "laut Google deutlich besser als Gemma3 27b bei der Übersetzung", merkte aber an, dass diese Benutzer-Benutzer-Prompts anstelle des System-Benutzer-Formats verwenden. Er hat sie aufgrund dieses Formatunterschieds nicht selbst ausprobiert.
Für schwedische Übersetzungen speziell wurde GPT SW3 20b als "gut, wenn es funktioniert, was selten ist (lehnt meinen System-Prompt ab)" beschrieben.
Der Entwickler erwähnte auch, dass er zu Testversionen von Gemini 2.5 Flash und Gemini 2.5 Flash-lite gewechselt ist, nicht weil lokale Übersetzungen schlecht waren, sondern weil er "immer noch einige Fehler bemerkte". Er überlegt zwischen Deepseek, OpenAI, Gemini, z.AI und Claude für günstige Übersetzungen, wobei ChatGPT Thinking seine Qualitätsmesslatte ist.
Er erwähnte einige kostenlose API-Schlüsseloptionen über: NVIDIA NIM, Routeway, Kilo, OpenCode und Puter.js, hat sie aber nicht ausprobiert. Er testete die GLM-4.7-Flash-API direkt von z.ai und fand sie "ziemlich gut, auf Gemma 3 27b-Niveau oder sogar besser", stieß aber bei Wortnachschlägen zusätzlich zu Untertitelübersetzungen auf Ratenbegrenzungen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Migration von OpenClaw-Agenten zu Claude Code nach der Einstellung von Drittanbieter-Harness
Ein Entwickler migrierte 17 OpenClaw-Agenten an einem Nachmittag zu Claude Code, nachdem Anthropic die Unterstützung für Drittanbieter-Harnesses beendet hatte. Der Prozess umfasste die Erstellung von CLAUDE.md-Einstiegspunkten, Bash-Wrappern und Cron-Jobs bei gleichzeitiger Beibehaltung der bestehenden Agentenlogik.

Installationshürden von OpenClaw auf Windows 11 für Nicht-Entwickler
Ein Hobby-Bastler beschreibt drei spezifische Hindernisse bei der Installation von OpenClaw auf einem 200-Dollar-Mini-PC mit Windows 11, darunter PowerShell-Ausführungsrichtlinien, Windows Defender-Blockaden und fehlende Abhängigkeiten wie Node.js und Git.

Qwen3.x-Modelle schlagen in OpenClaw aufgrund eines Formatfehlers bei der Streaming-Ausgabe stillschweigend fehl
Qwen3.x-Modelle im Streaming-Modus geben ihre Antworten im 'reasoning'-Feld statt im 'content'-Feld aus, wodurch OpenClaw stillschweigend auf Fallback-Modelle zurückgreift. Ein Proxy, der API-Formate übersetzt und 'think: false' einfügt, behebt das Problem und ermöglicht die vollständige Tool-Call-Auswertung.

Dokumentation zum Schreiben von MCP-Tools in C# .NET Framework für Claude Desktop/Code
Vollständige Dokumentation und C#-Codebeispiele zur Erstellung benutzerdefinierter MCP-Tools mit .NET Framework 4.8, die es Claude Desktop/Code ermöglichen, Interaktionen mit externen Prozessen, Software, APIs und IoT-Geräten zu automatisieren.