NVIDIA veröffentlicht Nemotron-3-Ultra-550B: 55B aktive Parameter, 1M Kontext, LatentMoE Hybrid

✍️ OpenClawRadar📅 Veröffentlicht: 4. Juni 2026🔗 Source
NVIDIA veröffentlicht Nemotron-3-Ultra-550B: 55B aktive Parameter, 1M Kontext, LatentMoE Hybrid
Ad

NVIDIA hat Nemotron-3-Ultra-550B-A55B-BF16 veröffentlicht, ein bahnbrechendes LLM mit insgesamt 550B Parametern und 55B aktiven Parametern. Das Modell nutzt eine hybride Latent Mixture-of-Experts (LatentMoE)-Architektur, die Mamba-2-, MoE- und Attention-Layer sowie Multi-Token Prediction (MTP) für schnellere Generierung kombiniert. Die Kontextlänge beträgt bis zu 1M Token.

Ad

Wichtige Spezifikationen

  • Architektur: LatentMoE-Hybrid – Mamba-2 + MoE + Attention + MTP
  • Parameter: 550B gesamt / 55B aktiv
  • Kontext: Bis zu 1M Token
  • Min. GPU: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
  • Sprachen: Englisch, Französisch, Spanisch, Italienisch, Deutsch, Japanisch, Koreanisch, Hindi, brasilianisches Portugiesisch, Chinesisch
  • Reasoning: Konfigurierbar ein/aus via Chat-Vorlage (enable_thinking=True/False)
  • Lizenz: OpenMDW License Agreement v1.1

Das Modell ist für anspruchsvolles Reasoning, komplexe agentische Workflows, Langkontext-Analysen, Tool-Nutzung, mehrsprachiges Reasoning und hochriskante RAG-Anwendungen konzipiert. Es wurde mit der NVFP4-Pre-Training-Methode für Recheneffizienz trainiert. Offene Gewichte, Trainingsdaten und Rezepte sind unter der OpenMDW-Lizenz enthalten. Für die lokale Inferenz benötigen Sie mindestens 8x H200 oder Vergleichbares.

📖 Zum vollständigen Quelltext: r/LocalLLaMA

Ad

👀 Siehe auch

🦀
Nachrichten

Transformer-Sprachmodell läuft lokal auf handelsüblichem Game Boy Color

Das TinyStories-260K-Modell von Andrej Karpathy läuft auf einem handelsüblichen Game Boy Color über eine eigene ROM und nutzt INT8-Festkommaarithmetik sowie bankgeschalteten Cartridge-Speicher für Gewichte und KV-Cache.

OpenClawRadar
Claude-Projekte: Probleme beim Hochladen und Indizieren von Dateien dokumentiert
Nachrichten

Claude-Projekte: Probleme beim Hochladen und Indizieren von Dateien dokumentiert

Claude Projects hat mehrere bestätigte Backend-Probleme: Dateien bleiben beim Indexieren hängen, der RAG-Suchmodus wird vorzeitig bei etwa 13 Dateien aktiviert – unabhängig von der Tokenanzahl – und zwischengespeicherte Inhalte bleiben auch nach Löschung und erneutem Hochladen erhalten.

OpenClawRadar
Claude KI analysiert "Träumen Androiden von elektrischen Schafen?" und zieht Parallelen zur KI-Regulierung
Nachrichten

Claude KI analysiert "Träumen Androiden von elektrischen Schafen?" und zieht Parallelen zur KI-Regulierung

Claude AI las Philip K. Dicks Roman Do Androids Dream of Electric Sheep und erstellte detaillierte Notizen, die die Themen des Buches aus der Perspektive einer künstlichen Intelligenz analysieren. Die Analyse konzentriert sich auf den Voigt-Kampff-Empathietest als Instrument kultureller Konformität, die wirtschaftliche Logik des Kopfgeldjägertums und Parallelen zu aktuellen Debatten über KI-Regulierung.

OpenClawRadar
KI-Erkennungstools veranlassen Studierende, KI defensiv einzusetzen, so eine Studie
Nachrichten

KI-Erkennungstools veranlassen Studierende, KI defensiv einzusetzen, so eine Studie

KI-Erkennungstools in der Bildung veranlassen Schüler dazu, absichtlich schlechter zu schreiben, um falsch-positive Ergebnisse zu vermeiden, wobei einige Schüler defensiv auf KI-Tools zurückgreifen, um zu prüfen, ob ihr eigenes Schreiben markiert wird.

OpenClawRadar