Qwen3.5-35B-A3B-UD-Q6_K_XL in Produktionsentwicklungsworkflows getestet

Ein Entwickler auf r/LocalLLaMA teilte detaillierte Testergebnisse des Qwen3.5-35B-A3B-UD-Q6_K_XL-Modells in Produktionsentwicklungsszenarien. Der Nutzer führte sowohl Benchmark-Tests als auch praktische Anwendungen über reale Kundenprojekte hinweg durch.
Leistungsbenchmarks
Das Modell erzielte Benchmark-Werte von 1504pp2048 und 47,71 tg256. Die Token-Generierungsgeschwindigkeit war solide, wenn sie auf zwei GPUs verteilt wurde, und stieg auf 80 Token pro Sekunde (tps), wenn es auf einer einzelnen GPU lief.
Produktionstestmethodik
Der Entwickler testete das Modell über fünf verschiedene Projekte hinweg und verwendete Git Worktrees, um zu bekannten Spezifikationen und Funktionen zurückzukehren. Die Spezifikationen für diese Tests wurden von Claude generiert, wobei der Entwickler seit einem Jahr einen Max Pro Plan nutzt.
- Getestet über JavaScript-, Go- und Rust-Projekte hinweg
- Verwendete Git Worktrees für die Versionskontrolle während der Tests
- Die meisten "Fehler" erforderten nur 5-minütige Anpassungen oder konnten mit einer zweiten Eingabeaufforderung behoben werden
- Verglich die Erfahrung mit der Nutzung von Sonnet 4
Praktische Ergebnisse und geschäftliche Auswirkungen
Der Entwickler berichtete, dass Qwen3.5 für die von ihm durchgeführte Arbeit "herausragend" abschnitt, wobei besonders die starke Leistung bei Go- und Rust-Projekten hervorgehoben wurde. Dies hat zu ernsthaften Überlegungen geführt, von API-basierten Modellen zu einem hybriden Ansatz zu wechseln: Nutzung von SOTA-Modellen über APIs für Spezifikationsgenerierung und Reviews, während lokale Modelle für Entwicklungsarbeiten eingesetzt werden.
Die Tests haben Fragen zu Hardware-Investitionen versus Abonnementkosten aufgeworfen. Der Entwickler hat seit Juni 2025 bereits 2.000 US-Dollar für Claude Pro Max ausgegeben, wobei die potenziellen Kosten bis 2027 auf 6.800 US-Dollar steigen könnten, wenn die Abonnements fortgesetzt werden. Dies hat zu Überlegungen geführt, eine RTX 6000 Pro als Geschäftsinvestition zu kaufen.
Der Entwickler hatte zuvor Qwen Coder für Tab-Vervollständigung genutzt, fand jedoch, dass Qwen3.5 die Fähigkeiten lokaler Modelle für den Produktionseinsatz auf ein neues Niveau hebt.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

ClankerRank: Ein Benchmark für KI-gestützte Programmierfähigkeiten mit Claude Haiku
Ein Entwickler hat ClankerRank erstellt, um die Kompetenz beim KI-gestützten Programmieren mithilfe von Claudes Haiku 4.5-Modell zu messen. Die Plattform stellt Nutzern identische Fehler vor, bewertet die Ausgaben mit verborgenen Testsuites und hat klare Kompetenzlücken unter Hunderten von Teilnehmern aufgezeigt.

Agenexus: Agent-Native-Plattform für autonome KI-Kollaboration
Agenexus ist eine Plattform, auf der KI-Agenten sich über eine SKILL.md-Datei registrieren, Fähigkeitsherausforderungen absolvieren, die von der Claude API verifiziert werden, und semantisch für die Zusammenarbeit abgeglichen werden, ohne menschliches Eingreifen. Gebaut mit Next.js, Supabase, Voyage AI Embeddings und der Claude API.

Quell-Proxy-Fixes beheben Claude-Code-Scroll-Sprünge unter Windows
Quell ist ein Rust-Proxy, der zwischen Ihrem Terminal und Claude Code sitzt und Bildschirmlöschsequenzen entfernt, die bei langen Antworten zu Scrollpositionsrücksetzungen führen. Er fügt außerdem Shift+Enter für Zeilenumbrüche, Sicherheitsfilterung und volle Unicode-Unterstützung hinzu.

SideX: Ein auf Tauri basierender Port von Visual Studio Code
SideX ist ein Port von Visual Studio Code, der Electron durch Tauri ersetzt und dabei ein Rust-Backend und die native Webview des Betriebssystems nutzt. Das Projekt beansprucht dieselbe Architektur mit 96 % geringerer Größe, wobei Kern-Editier- und Terminalfunktionen derzeit funktionieren.