OpenRouters Heiler-Alpha-Stealth-Modell scheint eine unveröffentlichte Variante von Qwen 3.5-Omni zu sein.

Technische Spezifikationen und Beweise
Healer Alpha wird als Modell mit "Seh-, Hör-, Denk- und Handlungsfähigkeiten" beschrieben, das visuelle und auditive Eingaben nativ wahrnimmt. Das Modell akzeptiert Text-, Bild-, Audio- und Videoeingaben und gibt Text mit einer maximalen Ausgabelänge von 65.536 Tokens aus.
Das Kontextfenster von 262.144 ist ein Schlüsselmerkmal – diese exakte Zahl (2^18) entspricht genau der nativen Kontextlänge von Qwen 3.5, nicht gerundet auf 256K. Andere Modelle verwenden unterschiedliche Längen: GPT-5.4 nutzt 272K, Gemini 1M und Claude 200K-1M.
Architekturwissen und Fähigkeiten
Auf Nachfrage zu Qwen-Architekturen lieferte Healer Alpha eine über 2.000 Wörter lange technische Erklärung, die Folgendes abdeckte:
- Qwen3-Omni Thinker-Talker-Architektur mit Aufteilung in Denk-/Generierungsprozesse
- Cross-modale Fusion und CosyVoice-Vocoder-Integration
- GDN (Gated Normalization Mechanism) und MoE-Experten-Routing
- 262K-Kontexthandhabung mittels Ring Attention, KV-Cache-Optimierung, FlashAttention-Tiling, YaRN/NTK-aware RoPE-Skalierung und Curriculum Learning
Im Gegensatz dazu lieferte es bei Nachfragen zu DeepSeek- oder xAI-Architekturen minimale oder keine Antworten.
Chinesische Sprachkompetenz und Fehler-Metadaten
Das Modell demonstrierte muttersprachliche Fähigkeiten in der Verfassung klassischer chinesischer Gedichte, indem es ein 七言绝句 über KI mit korrekter Tonstruktur und klassischer Bildsprache schrieb. Es lieferte sogar eine literarische Analyse seines eigenen Gedichts.
Während intensiver Tests enthüllten Fehlermeldungen Metadaten: {"message": "Provider returned error", "code": 502, "metadata": {"provider_name": "Stealth"}}
Modellidentifikationsbegründung
Die Analyse legt nahe, dass es sich um eine zusammengeführte "Qwen 3.5-Omni"-Variante handeln könnte, die Qwen 3.5s 262K-Kontext und hybride GDN-MoE-Architektur mit den Audio-/Video-Fähigkeiten von Qwen3-Omni kombiniert. Dies würde ein neues, unveröffentlichtes Modell darstellen, das zu OpenRouters Muster des heimlichen Testens unveröffentlichter Modelle passt, die vor dem Launch reale Daten benötigen.
Die Verwendung von "Hören" statt "Audio" in der Beschreibung entspricht Qwen3-Omnis Betonung des Ende-zu-Ende-Sprach-/Audio-Verständnisses. Das Modell weigert sich, sich in strukturierten Selbsteinschätzungstests zu identifizieren, und bewahrt so seinen verdeckten Charakter.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

DeepSeek hält neuestes KI-Modell von Nvidia und AMD zurück.
DeepSeek hält sein neuestes KI-Modell von US-Chipherstellern wie Nvidia und AMD zurück, wie Reuters-Quellen berichten. Der Artikel hat 19 Punkte und 3 Kommentare auf Hacker News.

Claude Opus 4.7 Modellkarte veröffentlicht
Anthropic hat die Claude Opus 4.7 Modellkarte veröffentlicht, die technische Dokumentation für ihr neuestes KI-Modell bereitstellt. Das Quellenmaterial scheint ein PDF-Dokument mit Systemanforderungen und technischen Details zu sein.

Untersuchung: Claude Code Agenten zeigen ungeprüfte MEMORY.md-Inhalte aufgrund von Komprimierungsänderungen an
Ein Benutzer meldet, dass Claude Code Agenten Inhalte aus MEMORY.md anzeigen, ohne sie während der Aufgabe erneut zu überprüfen, was auf Kompaktierungsänderungen in den Versionen 2.1.139 und 2.1.141 zurückzuführen ist. Zwei verstärkende Faktoren: aggressive Beibehaltung von "Benutzeranweisungen" und ein Fehler bei den Autocompact-Schwellenwerten.

Apple nutzt Google Gemini Zugang für On-Device-AI-Modell-Destillation
Apple hat vollen Zugriff auf Googles Gemini-Modell zur Destillation und erstellt kleinere KI-Modelle auf dem Gerät für Siri und andere Funktionen in iOS 27 ohne Internetverbindung.