NVIDIA veröffentlicht Nemotron-3-Ultra-550B: 55B aktive Parameter, 1M Kontext, LatentMoE Hybrid

NVIDIA hat Nemotron-3-Ultra-550B-A55B-BF16 veröffentlicht, ein bahnbrechendes LLM mit insgesamt 550B Parametern und 55B aktiven Parametern. Das Modell nutzt eine hybride Latent Mixture-of-Experts (LatentMoE)-Architektur, die Mamba-2-, MoE- und Attention-Layer sowie Multi-Token Prediction (MTP) für schnellere Generierung kombiniert. Die Kontextlänge beträgt bis zu 1M Token.
Wichtige Spezifikationen
- Architektur: LatentMoE-Hybrid – Mamba-2 + MoE + Attention + MTP
- Parameter: 550B gesamt / 55B aktiv
- Kontext: Bis zu 1M Token
- Min. GPU: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
- Sprachen: Englisch, Französisch, Spanisch, Italienisch, Deutsch, Japanisch, Koreanisch, Hindi, brasilianisches Portugiesisch, Chinesisch
- Reasoning: Konfigurierbar ein/aus via Chat-Vorlage (
enable_thinking=True/False) - Lizenz: OpenMDW License Agreement v1.1
Das Modell ist für anspruchsvolles Reasoning, komplexe agentische Workflows, Langkontext-Analysen, Tool-Nutzung, mehrsprachiges Reasoning und hochriskante RAG-Anwendungen konzipiert. Es wurde mit der NVFP4-Pre-Training-Methode für Recheneffizienz trainiert. Offene Gewichte, Trainingsdaten und Rezepte sind unter der OpenMDW-Lizenz enthalten. Für die lokale Inferenz benötigen Sie mindestens 8x H200 oder Vergleichbares.
📖 Zum vollständigen Quelltext: r/LocalLLaMA
👀 Siehe auch
Transformer-Sprachmodell läuft lokal auf handelsüblichem Game Boy Color
Das TinyStories-260K-Modell von Andrej Karpathy läuft auf einem handelsüblichen Game Boy Color über eine eigene ROM und nutzt INT8-Festkommaarithmetik sowie bankgeschalteten Cartridge-Speicher für Gewichte und KV-Cache.

Claude-Projekte: Probleme beim Hochladen und Indizieren von Dateien dokumentiert
Claude Projects hat mehrere bestätigte Backend-Probleme: Dateien bleiben beim Indexieren hängen, der RAG-Suchmodus wird vorzeitig bei etwa 13 Dateien aktiviert – unabhängig von der Tokenanzahl – und zwischengespeicherte Inhalte bleiben auch nach Löschung und erneutem Hochladen erhalten.

Claude KI analysiert "Träumen Androiden von elektrischen Schafen?" und zieht Parallelen zur KI-Regulierung
Claude AI las Philip K. Dicks Roman Do Androids Dream of Electric Sheep und erstellte detaillierte Notizen, die die Themen des Buches aus der Perspektive einer künstlichen Intelligenz analysieren. Die Analyse konzentriert sich auf den Voigt-Kampff-Empathietest als Instrument kultureller Konformität, die wirtschaftliche Logik des Kopfgeldjägertums und Parallelen zu aktuellen Debatten über KI-Regulierung.

KI-Erkennungstools veranlassen Studierende, KI defensiv einzusetzen, so eine Studie
KI-Erkennungstools in der Bildung veranlassen Schüler dazu, absichtlich schlechter zu schreiben, um falsch-positive Ergebnisse zu vermeiden, wobei einige Schüler defensiv auf KI-Tools zurückgreifen, um zu prüfen, ob ihr eigenes Schreiben markiert wird.