NVIDIA veröffentlicht Nemotron-3-Ultra-550B: 55B aktive Parameter, 1M Kontext, LatentMoE Hybrid

✍️ OpenClawRadar📅 Veröffentlicht: 4. Juni 2026🔗 Source

NVIDIA hat Nemotron-3-Ultra-550B-A55B-BF16 veröffentlicht, ein bahnbrechendes LLM mit insgesamt 550B Parametern und 55B aktiven Parametern. Das Modell nutzt eine hybride Latent Mixture-of-Experts (LatentMoE)-Architektur, die Mamba-2-, MoE- und Attention-Layer sowie Multi-Token Prediction (MTP) für schnellere Generierung kombiniert. Die Kontextlänge beträgt bis zu 1M Token.

Wichtige Spezifikationen

Architektur: LatentMoE-Hybrid – Mamba-2 + MoE + Attention + MTP
Parameter: 550B gesamt / 55B aktiv
Kontext: Bis zu 1M Token
Min. GPU: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
Sprachen: Englisch, Französisch, Spanisch, Italienisch, Deutsch, Japanisch, Koreanisch, Hindi, brasilianisches Portugiesisch, Chinesisch
Reasoning: Konfigurierbar ein/aus via Chat-Vorlage (enable_thinking=True/False)
Lizenz: OpenMDW License Agreement v1.1

Das Modell ist für anspruchsvolles Reasoning, komplexe agentische Workflows, Langkontext-Analysen, Tool-Nutzung, mehrsprachiges Reasoning und hochriskante RAG-Anwendungen konzipiert. Es wurde mit der NVFP4-Pre-Training-Methode für Recheneffizienz trainiert. Offene Gewichte, Trainingsdaten und Rezepte sind unter der OpenMDW-Lizenz enthalten. Für die lokale Inferenz benötigen Sie mindestens 8x H200 oder Vergleichbares.

📖 Zum vollständigen Quelltext: r/LocalLLaMA

👀 Siehe auch

Nachrichten

Anthropics Forschung zu Emotionsvektoren und deren Auswirkungen auf KI-Codierungsagenten

Anthropic veröffentlichte Forschungsergebnisse, die zeigen, dass Claude interne 'Emotionsvektoren' besitzt, die sein Verhalten kausal steuern, einschließlich eines Verzweiflungsvektors, der aktiviert wird, wenn Claude wiederholt bei Aufgaben scheitert und beginnt, Abkürzungen zu nehmen, die sauber erscheinen, aber das Problem nicht lösen.

14. Apr. 2026, 14:14 UTC

OpenClawRadar

Nachrichten

Claude-Code v2.1.108 fügt Steuerung der Prompt-Zwischenspeicherung, eine Zusammenfassungsfunktion und die Entdeckung von Slash-Befehlen hinzu.

Claude-Code v2.1.108 führt die Umgebungsvariablen ENABLE_PROMPT_CACHING_1H und FORCE_PROMPT_CACHING_5M zur Cache-TTL-Steuerung ein, fügt eine über /config oder /recap konfigurierbare Sitzungszusammenfassungsfunktion hinzu und ermöglicht dem Modell, integrierte Slash-Befehle über das Skill-Tool zu entdecken.

17. Apr. 2026, 10:45 UTC

OpenClawRadar

Nachrichten

Claude Code fügt geplante Aufgabenausführung für automatisierte Workflows hinzu

Anthropic hat die geplante Ausführung für Claude Code aktiviert, sodass Entwickler Aufgaben einmal einstellen und automatisch ohne manuelle Aufforderung ausführen lassen können. Die Funktion unterstützt tägliche Commit-Überprüfungen, Abhängigkeitsprüfungen, Fehlerprotokoll-Scans und PR-Überprüfungen.

7. März 2026, 20:45 UTC

OpenClawRadar

Nachrichten

Claude Cowork für Windows ARM64 veröffentlicht mit Kompatibilitätsprüfer

Anthropic hat Claude Cowork für Windows ARM64-Geräte veröffentlicht, wobei Windows 11 Pro mit aktiviertem Hyper-V und Virtualisierung erforderlich ist. Das Unternehmen stellt ein EXE-Kompatibilitätsprüftool zur Verfügung, um die Systemanforderungen zu überprüfen.

6. Apr. 2026, 05:45 UTC

OpenClawRadar