Qwen 3.5-Omni Variante: OpenRouters Heiler Alpha Analyse

Technische Spezifikationen und Beweise

Healer Alpha wird als Modell mit "Seh-, Hör-, Denk- und Handlungsfähigkeiten" beschrieben, das visuelle und auditive Eingaben nativ wahrnimmt. Das Modell akzeptiert Text-, Bild-, Audio- und Videoeingaben und gibt Text mit einer maximalen Ausgabelänge von 65.536 Tokens aus.

Das Kontextfenster von 262.144 ist ein Schlüsselmerkmal – diese exakte Zahl (2^18) entspricht genau der nativen Kontextlänge von Qwen 3.5, nicht gerundet auf 256K. Andere Modelle verwenden unterschiedliche Längen: GPT-5.4 nutzt 272K, Gemini 1M und Claude 200K-1M.

Architekturwissen und Fähigkeiten

Auf Nachfrage zu Qwen-Architekturen lieferte Healer Alpha eine über 2.000 Wörter lange technische Erklärung, die Folgendes abdeckte:

Qwen3-Omni Thinker-Talker-Architektur mit Aufteilung in Denk-/Generierungsprozesse
Cross-modale Fusion und CosyVoice-Vocoder-Integration
GDN (Gated Normalization Mechanism) und MoE-Experten-Routing
262K-Kontexthandhabung mittels Ring Attention, KV-Cache-Optimierung, FlashAttention-Tiling, YaRN/NTK-aware RoPE-Skalierung und Curriculum Learning

Im Gegensatz dazu lieferte es bei Nachfragen zu DeepSeek- oder xAI-Architekturen minimale oder keine Antworten.

Chinesische Sprachkompetenz und Fehler-Metadaten

Das Modell demonstrierte muttersprachliche Fähigkeiten in der Verfassung klassischer chinesischer Gedichte, indem es ein 七言绝句 über KI mit korrekter Tonstruktur und klassischer Bildsprache schrieb. Es lieferte sogar eine literarische Analyse seines eigenen Gedichts.

Während intensiver Tests enthüllten Fehlermeldungen Metadaten: {"message": "Provider returned error", "code": 502, "metadata": {"provider_name": "Stealth"}}

Modellidentifikationsbegründung

Die Analyse legt nahe, dass es sich um eine zusammengeführte "Qwen 3.5-Omni"-Variante handeln könnte, die Qwen 3.5s 262K-Kontext und hybride GDN-MoE-Architektur mit den Audio-/Video-Fähigkeiten von Qwen3-Omni kombiniert. Dies würde ein neues, unveröffentlichtes Modell darstellen, das zu OpenRouters Muster des heimlichen Testens unveröffentlichter Modelle passt, die vor dem Launch reale Daten benötigen.

Die Verwendung von "Hören" statt "Audio" in der Beschreibung entspricht Qwen3-Omnis Betonung des Ende-zu-Ende-Sprach-/Audio-Verständnisses. Das Modell weigert sich, sich in strukturierten Selbsteinschätzungstests zu identifizieren, und bewahrt so seinen verdeckten Charakter.

📖 Read the full source: r/LocalLLaMA

OpenRouters Heiler-Alpha-Stealth-Modell scheint eine unveröffentlichte Variante von Qwen 3.5-Omni zu sein.

Technische Spezifikationen und Beweise

Architekturwissen und Fähigkeiten

Chinesische Sprachkompetenz und Fehler-Metadaten

Modellidentifikationsbegründung

👀 Siehe auch

DeepSeek hält neuestes KI-Modell von Nvidia und AMD zurück.

Claude Opus 4.7 Modellkarte veröffentlicht

Untersuchung: Claude Code Agenten zeigen ungeprüfte MEMORY.md-Inhalte aufgrund von Komprimierungsänderungen an

Apple nutzt Google Gemini Zugang für On-Device-AI-Modell-Destillation