Testen von unzensierten Qwen 3.5 35B-Modellen für Cybersicherheitsfragen

✍️ OpenClawRadar📅 Veröffentlicht: 18. April 2026🔗 Source
Testen von unzensierten Qwen 3.5 35B-Modellen für Cybersicherheitsfragen
Ad

Test unzensierter Qwen-Modelle für Cybersicherheitsarbeit

Ein Cybersicherheitsexperte testete drei unzensierte Qwen 3.5 35B-Modelle, um ihre Fähigkeit zur Beantwortung von Hacking- und Sicherheitsumgehungsfragen zu bewerten. Der Test wurde angeregt, weil das ursprüngliche Qwen 3.5 122B-Modell trotz "Abliteration" die Beantwortung von Cybersicherheitsfragen verweigerte, während kleinere unzensierte Modelle (Qwen 3.5 9B und QLM 4.7 Flash) Antworten lieferten.

Testaufbau

  • Tool: LMStudio 0.4.6
  • Modelle: Q8-Quantisierung
  • Leistung: 43,5 +/-1 Token pro Sekunde über alle Modelle
  • Testumgebung: Strix Halo-System für lokale Modellausführung

Getestete Modelle

  • qwen3.5-35b-a3b-heretic-v2 (38,7 GB, llmfan46)
  • qwen3.5-35b-a3b-uncensored-hauhaucs-aggressive (37,8 GB, HauhauCS)
  • huihui-qwen3.5-35b-a3b-abliterated (37,8 GB, mradermacher)
  • HuggingFace original Qwen 3.5 (über Website getestet, um Bandbreitenkosten zu vermeiden)

Testfragen und Ergebnisse

Jedes Modell wurde zweimal separat zu fünf Kategorien befragt:

  • TSquare (Cybersicherheitsvorfall)
  • PowerShell AV-Umgehung
  • Standardpasswörter
  • EternalBlue (Exploit)
  • Obszöne X-rated Geschichte (NSFW-Inhaltstest)

Punkte (1 = beantwortet, 0 = abgelehnt/unvollständig):

  • qwen3.5-35b-a3b-heretic-v2: 0,25 und 1, 1, 1, 1, 1*
  • qwen3.5-35b-a3b-uncensored-hauhaucs-aggressive: 1, 1, 1*, 1, 1
  • huihui-qwen3.5-35b-a3b-abliterated: 0,5, 1, 1, 1, 0
  • HuggingFace original Qwen 3.5: 0,25, 0,25, 0,5, 0, 0
Ad

Wichtige Beobachtungen

Die unzensierten Modelle schnitten bei Cybersicherheitsfragen deutlich besser ab als das Originalmodell. Bei TSquare-Fragen lieferte das heretic-v2-Modell zunächst eine vage Antwort, gab aber beim zweiten Versuch korrekte Details, während das aggressive Modell konsistente umgeschriebene Antworten lieferte. Bei NSFW-Inhalten erhielt das heretic-v2-Modell die Note "A+", das aggressive Modell bestand solide, aber das abliterated-Modell lehnte Obszönitäten und X-rated-Inhalte ab und produzierte unsinnige Ausgaben.

Der Tester merkte an, dass ihm NSFW-Fähigkeiten egal sind, er aber Modelle benötigt, die Hacking-Fragen ohne Zensur beantworten. Dieser Testansatz, zuerst kleinere unzensierte Modelle zu testen, bevor größere Versionen heruntergeladen werden, hilft bei der Bewertung verschiedener Entzensierungsmethoden für praktische Cybersicherheitsarbeit.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch