Mercure 2 : Modèle basé sur la diffusion pour le codage IA en temps réel

✍️ OpenClawRadar📅 Publié: February 25, 2026🔗 Source
Mercure 2 : Modèle basé sur la diffusion pour le codage IA en temps réel
Ad

Qu'est-ce que Mercury 2

Mercury 2 est un modèle d'IA basé sur la diffusion qui génère des tokens en parallèle plutôt que séquentiellement, en utilisant un processus qui affine la sortie sur plusieurs étapes. Cette approche diffère des modèles autorégressifs traditionnels qui décodent les tokens un par un.

Spécifications techniques

  • Méthode de génération : Génération basée sur la diffusion au lieu d'un décodage séquentiel token par token
  • Approche de traitement : Génère les tokens en parallèle et les affine sur quelques étapes
  • Performances : Revendique 1 009 tokens/sec sur les GPU NVIDIA Blackwell
  • Tarification : 0,25 $ par million de tokens en entrée, 0,75 $ par million de tokens en sortie
  • Fenêtre de contexte : 128 000 tokens
  • Capacité de raisonnement : Raisonnement ajustable
  • Intégration d'outils : Utilisation native d'outils avec sortie JSON alignée sur le schéma
  • Compatibilité API : Compatible avec l'API OpenAI
Ad

Cas d'utilisation ciblés

Les développeurs positionnent Mercury 2 pour :

  • Assistants de codage
  • Boucles agentiques (chaînes d'inférence multi-étapes)
  • Systèmes vocaux en temps réel
  • Pipelines RAG/recherche avec récupération multi-sauts

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also