NVIDIA dévoile Nemotron-3-Ultra-550B : 55B paramètres actifs, contexte 1M, hybride LatentMoE

NVIDIA a publié Nemotron-3-Ultra-550B-A55B-BF16, un LLM à l'échelle frontière avec 550B paramètres totaux et 55B actifs. Le modèle utilise une architecture hybride Latent Mixture-of-Experts (LatentMoE) qui entrelace les couches Mamba-2, MoE et d'attention, plus la prédiction multi-tokens (MTP) pour une génération plus rapide. La longueur de contexte atteint jusqu'à 1M tokens.
Spécifications clés
- Architecture : LatentMoE hybride – Mamba-2 + MoE + Attention + MTP
- Paramètres : 550B total / 55B actifs
- Contexte : Jusqu'à 1M tokens
- GPU minimum : 8x GB200/B200/GB300/B300, 16x H100, 8x H200
- Langues : anglais, français, espagnol, italien, allemand, japonais, coréen, hindi, portugais brésilien, chinois
- Raisonnement : Activable/désactivable via le modèle de chat (
enable_thinking=True/False) - Licence : OpenMDW License Agreement v1.1
Le modèle est conçu pour le raisonnement de pointe, les workflows agentiques complexes, l'analyse de longs contextes, l'utilisation d'outils, le raisonnement multilingue et le RAG à enjeux élevés. Il est entraîné avec la recette de pré-entraînement NVFP4 pour l'efficacité computationnelle. Les poids ouverts, les données d'entraînement et les recettes sont inclus sous la licence OpenMDW. Pour l'inférence locale, vous aurez besoin d'au moins 8x H200 ou équivalent.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Claude Opus 4.6 et Sonnet 4.6 proposent désormais un contexte de 1 million de tokens au tarif standard.
Claude Opus 4.6 et Sonnet 4.6 incluent désormais une fenêtre de contexte complète de 1 million à tarif standard sans supplément pour contexte long, ainsi que des limites médias étendues à 600 images ou pages PDF par requête.

Cimetière IA : 100 outils IA fermés ou acquis répertoriés – 88 rien qu'en 2026
Le cimetière IA de ToolDirectory.ai recense 100 produits IA disparus ou acquis, avec 88 morts enregistrées en 2026. Les catégories incluent les outils de développement, les agents IA, le support client, et plus encore, de nombreuses acquisitions ayant été intégrées dans des plateformes plus grandes comme Salesforce.

YC-Bench évalue les LLM en tant que PDG de startups, GLM-5 démontre une forte rentabilité
Des chercheurs ont créé YC-Bench, un benchmark où les LLM jouent le rôle de PDG de startups simulées sur une année, gérant des employés, des contrats et des salaires. GLM-5 a atteint 1,21 million de dollars de fonds finaux moyens à 7,62 dollars par exécution, se situant à moins de 5 % de Claude Opus 4.6 qui coûtait 86 dollars par exécution.

Claude Desktop v1.1.5749 Ajoute le Contrôle de l'Ordinateur et des Corrections pour les Proxys d'Entreprise
Claude Desktop v1.1.5749 introduit la capacité d'utilisation de l'ordinateur avec un serveur MCP pour le contrôle du bureau, ajoute six méthodes de gestion des autorisations TCC macOS, et corrige les problèmes de certificats SSL des proxys d'entreprise en transmettant les variables d'environnement NODE_EXTRA_CA_CERTS, SSL_CERT_FILE et SSL_CERT_DIR.