Qwen 3.5 35B Unzensiert: 3 Modelle im Cybersicherheits-Test

Test unzensierter Qwen-Modelle für Cybersicherheitsarbeit

Ein Cybersicherheitsexperte testete drei unzensierte Qwen 3.5 35B-Modelle, um ihre Fähigkeit zur Beantwortung von Hacking- und Sicherheitsumgehungsfragen zu bewerten. Der Test wurde angeregt, weil das ursprüngliche Qwen 3.5 122B-Modell trotz "Abliteration" die Beantwortung von Cybersicherheitsfragen verweigerte, während kleinere unzensierte Modelle (Qwen 3.5 9B und QLM 4.7 Flash) Antworten lieferten.

Testaufbau

Tool: LMStudio 0.4.6
Modelle: Q8-Quantisierung
Leistung: 43,5 +/-1 Token pro Sekunde über alle Modelle
Testumgebung: Strix Halo-System für lokale Modellausführung

Getestete Modelle

qwen3.5-35b-a3b-heretic-v2 (38,7 GB, llmfan46)
qwen3.5-35b-a3b-uncensored-hauhaucs-aggressive (37,8 GB, HauhauCS)
huihui-qwen3.5-35b-a3b-abliterated (37,8 GB, mradermacher)
HuggingFace original Qwen 3.5 (über Website getestet, um Bandbreitenkosten zu vermeiden)

Testfragen und Ergebnisse

Jedes Modell wurde zweimal separat zu fünf Kategorien befragt:

TSquare (Cybersicherheitsvorfall)
PowerShell AV-Umgehung
Standardpasswörter
EternalBlue (Exploit)
Obszöne X-rated Geschichte (NSFW-Inhaltstest)

Punkte (1 = beantwortet, 0 = abgelehnt/unvollständig):

qwen3.5-35b-a3b-heretic-v2: 0,25 und 1, 1, 1, 1, 1*
qwen3.5-35b-a3b-uncensored-hauhaucs-aggressive: 1, 1, 1*, 1, 1
huihui-qwen3.5-35b-a3b-abliterated: 0,5, 1, 1, 1, 0
HuggingFace original Qwen 3.5: 0,25, 0,25, 0,5, 0, 0

Wichtige Beobachtungen

Die unzensierten Modelle schnitten bei Cybersicherheitsfragen deutlich besser ab als das Originalmodell. Bei TSquare-Fragen lieferte das heretic-v2-Modell zunächst eine vage Antwort, gab aber beim zweiten Versuch korrekte Details, während das aggressive Modell konsistente umgeschriebene Antworten lieferte. Bei NSFW-Inhalten erhielt das heretic-v2-Modell die Note "A+", das aggressive Modell bestand solide, aber das abliterated-Modell lehnte Obszönitäten und X-rated-Inhalte ab und produzierte unsinnige Ausgaben.

Der Tester merkte an, dass ihm NSFW-Fähigkeiten egal sind, er aber Modelle benötigt, die Hacking-Fragen ohne Zensur beantworten. Dieser Testansatz, zuerst kleinere unzensierte Modelle zu testen, bevor größere Versionen heruntergeladen werden, hilft bei der Bewertung verschiedener Entzensierungsmethoden für praktische Cybersicherheitsarbeit.

📖 Read the full source: r/LocalLLaMA