Nvidias Nemotron 3 Super: 120-Milliarden-Parameter-Modell mit 12 Milliarden aktiven Inferenzparametern

✍️ OpenClawRadar📅 Veröffentlicht: 12. März 2026🔗 Source
Nvidias Nemotron 3 Super: 120-Milliarden-Parameter-Modell mit 12 Milliarden aktiven Inferenzparametern
Ad

Nvidia hat Nemotron 3 Super veröffentlicht, ein Modell mit 120 Milliarden Parametern, das während der Inferenz nur 12 Milliarden Parameter aktiviert. Dies stellt die Annahme in Frage, dass größere Modelle immer bessere Ergebnisse liefern, indem es das Wissen eines 120-Milliarden-Modells zu etwa den Rechenkosten eines 12-Milliarden-Modells bietet. Das Modell approximiert kein größeres Modell durch Kompression – es ist ein 120-Milliarden-Modell, das gelernt hat, effizient zu routen, wobei die anderen 108 Milliarden Parameter verfügbar sind, wenn sie relevant sind, und inaktiv, wenn nicht.

Architekturentscheidungen

Drei wichtige Architekturentscheidungen machen dies möglich:

  • LatentMoE: Projiziert Tokens in einen komprimierten latenten Raum vor dem Routing, wodurch Routing-Entscheidungen günstiger werden. Dies ermöglicht die Aktivierung von 4x mehr Experten für die gleichen Inferenzkosten wie bei Standard-MoE.
  • Hybrid Mamba-Attention: Ersetzt die quadratisch teure Transformer-Attention durch Mamba-2 für die meiste Sequenzverarbeitung, wodurch das 1-Millionen-Token-Kontextfenster praktisch statt theoretisch wird. Erreicht 91,75 % Genauigkeit auf RULER bei 1M Tokens.
  • Multi-Token-Vorhersage: Generiert mehrere zukünftige Tokens pro Vorwärtsdurchlauf und bietet native spekulative Decodierung mit bis zu 3x schnellerer Echtzeit-Inferenz ohne separates Draft-Modell. Führt zu 5x höherem Durchsatz als sein Vorgänger und übertrifft Modelle, die 3x mehr Parameter pro Token aktivieren.
Ad

Breiterer Trend

Dies ist die dritte unabhängige Bestätigung dieses Architekturansatzes. DeepSeek V3 demonstrierte dies zuerst mit 671 Milliarden Gesamtparametern und 37 Milliarden aktiven, wobei es Llama 3 405B dicht übertraf. Qwen3-Coder-Next folgte mit 80 Milliarden Gesamtparametern und nur 3 Milliarden aktiven bei der Inferenz, was Claude Sonnet 4.5 auf SWE-Bench Pro entsprach und DeepSeek V3 übertraf, das 37 Milliarden pro Token aktiviert. Die Effizienzgewinne verstärken sich gegenseitig statt sich abzutauschen – jede Architekturentscheidung profitiert mehr von der Skalierung als dichte Attention, und die Lücke zwischen dieser Architektur und dichten Transformern wächst mit der Skalierung der Modelle.

Die zentrale Erkenntnis aus diesen drei unabhängigen Veröffentlichungen ist, dass der Weg zu Fähigkeiten nicht mehr Aktivierung ist – sondern besseres Routing. Während Parameterzahlen-Ranglisten weiterhin Zahlen veröffentlichen, werden aktive Parameter pro Token zur ehrlicheren Metrik für den Vergleich von Modelleffizienz und -leistung.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Anthropic Urheberrechtsabkommen – Details für Entwickler
Nachrichten

Anthropic Urheberrechtsabkommen – Details für Entwickler

Anthropic hat eine 1,5-Milliarden-Dollar-Kopieklage beigelegt, die die Nutzung von Werken zum Trainieren von KI-Modellen betrifft. Berechtigte Urheberrechtsinhaber können 500 bis 3.000 US-Dollar pro validiertem Werk beanspruchen, mit einer Frist bis zum 23. März 2026.

OpenClawRadar
Atlassian entlässt 10 % der Belegschaft, um KI-Investitionen zu finanzieren.
Nachrichten

Atlassian entlässt 10 % der Belegschaft, um KI-Investitionen zu finanzieren.

Atlassian streicht 1.600 Stellen (10 % der Belegschaft), um KI-Investitionen selbst zu finanzieren und sein Finanzprofil zu stärken. Davon sind 900 Positionen in der Softwareentwicklung betroffen. CEO Mike Cannon-Brookes sagt, KI ersetze keine Menschen, verändere aber die Anforderungen an Fähigkeiten.

OpenClawRadar
Encyclopedia Britannica reicht Klage gegen OpenAI wegen KI-Trainingsdaten ein
Nachrichten

Encyclopedia Britannica reicht Klage gegen OpenAI wegen KI-Trainingsdaten ein

Encyclopedia Britannica hat eine Klage gegen OpenAI eingereicht und behauptet, dass Urheberrechte im Zusammenhang mit KI-Trainingsdaten verletzt wurden. Der Fall wurde von Reuters am 16. März 2026 gemeldet und hat auf Hacker News Diskussionen ausgelöst.

OpenClawRadar
Medvis KI-Unternehmen im Wert von 1,8 Milliarden Dollar sieht sich mit rechtlichen und ethischen Bedenken konfrontiert
Nachrichten

Medvis KI-Unternehmen im Wert von 1,8 Milliarden Dollar sieht sich mit rechtlichen und ethischen Bedenken konfrontiert

Gary Marcus kritisiert die virale Geschichte von Medvi, einem angeblich 1,8 Milliarden Dollar schweren KI-Unternehmen, das von einer Person in zwei Monaten aufgebaut wurde. Er weist auf Sammelklagen wegen Spam-Verstößen sowie auf Fragen zur Umsatzberichterstattung und Compliance hin.

OpenClawRadar