Mercure 2 : Modèle basé sur la diffusion pour le codage IA en temps réel

Qu'est-ce que Mercury 2
Mercury 2 est un modèle d'IA basé sur la diffusion qui génère des tokens en parallèle plutôt que séquentiellement, en utilisant un processus qui affine la sortie sur plusieurs étapes. Cette approche diffère des modèles autorégressifs traditionnels qui décodent les tokens un par un.
Spécifications techniques
- Méthode de génération : Génération basée sur la diffusion au lieu d'un décodage séquentiel token par token
- Approche de traitement : Génère les tokens en parallèle et les affine sur quelques étapes
- Performances : Revendique 1 009 tokens/sec sur les GPU NVIDIA Blackwell
- Tarification : 0,25 $ par million de tokens en entrée, 0,75 $ par million de tokens en sortie
- Fenêtre de contexte : 128 000 tokens
- Capacité de raisonnement : Raisonnement ajustable
- Intégration d'outils : Utilisation native d'outils avec sortie JSON alignée sur le schéma
- Compatibilité API : Compatible avec l'API OpenAI
Cas d'utilisation ciblés
Les développeurs positionnent Mercury 2 pour :
- Assistants de codage
- Boucles agentiques (chaînes d'inférence multi-étapes)
- Systèmes vocaux en temps réel
- Pipelines RAG/recherche avec récupération multi-sauts
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Joint-venture de 10 milliards de dollars d'OpenAI en capital-investissement : implications pour le déploiement de l'IA
OpenAI finalise une coentreprise de 10 milliards de dollars avec des sociétés de capital-investissement pour étendre l'infrastructure d'IA et le déploiement en entreprise, selon Bloomberg.

Stratégie commerciale d'Anthropic : Les revenus de l'API motivent les limitations du service grand public
Les abonnements grand public d'Anthropic fonctionnent à perte, subventionnés pour développer la notoriété de l'IA, tandis que leur activité API génère des revenus. Le niveau Pro à 20 $ est intentionnellement limité pour orienter les utilisateurs vers les abonnements Max à plus forte valeur.

Opus 4.7 s’injecte lui-même et fuit le prompt système
Les utilisateurs de Claude Opus 4.7 signalent que le modèle injecte de faux prompts système et divulgue des parties de prompts système réels sans aucun déclencheur utilisateur.

L'API Claude a connu des taux d'erreur élevés sur plusieurs modèles le 25 février 2026.
L'API de Claude sur api.anthropic.com a connu des taux d'erreur élevés sur plusieurs modèles le 25 février 2026, avec une enquête débutant à 17:15 UTC et une résolution confirmée à 17:46 UTC.