Mercure 2 : Modèle basé sur la diffusion pour le codage IA en temps réel

✍️ OpenClawRadar📅 Publié: February 25, 2026🔗 Source

Qu'est-ce que Mercury 2

Mercury 2 est un modèle d'IA basé sur la diffusion qui génère des tokens en parallèle plutôt que séquentiellement, en utilisant un processus qui affine la sortie sur plusieurs étapes. Cette approche diffère des modèles autorégressifs traditionnels qui décodent les tokens un par un.

Spécifications techniques

Méthode de génération : Génération basée sur la diffusion au lieu d'un décodage séquentiel token par token
Approche de traitement : Génère les tokens en parallèle et les affine sur quelques étapes
Performances : Revendique 1 009 tokens/sec sur les GPU NVIDIA Blackwell
Tarification : 0,25 $ par million de tokens en entrée, 0,75 $ par million de tokens en sortie
Fenêtre de contexte : 128 000 tokens
Capacité de raisonnement : Raisonnement ajustable
Intégration d'outils : Utilisation native d'outils avec sortie JSON alignée sur le schéma
Compatibilité API : Compatible avec l'API OpenAI

Cas d'utilisation ciblés

Les développeurs positionnent Mercury 2 pour :

Assistants de codage
Boucles agentiques (chaînes d'inférence multi-étapes)
Systèmes vocaux en temps réel
Pipelines RAG/recherche avec récupération multi-sauts

📖 Lire la source complète : r/LocalLLaMA

👀 See Also

News

Les Minions de Stripe : Agents d'IA de Codage en Une Seule Passe

Les Minions sont les agents d'IA de codage ponctuels de Stripe visant à améliorer la productivité des développeurs en tirant parti de l'automatisation de bout en bout grâce aux LLM.

Feb 13, 2026, 02:45 AM UTC

OpenClawRadar

News

DeepSeek-V4 Pro et Flash : 1,6 T de paramètres, contexte de 1 M de tokens, attention hybride

DeepSeek-V4-Pro (1,6 billion de paramètres, 49B activés) et V4-Flash (284B de paramètres, 13B activés) prennent en charge un contexte de 1 million de tokens. La nouvelle attention hybride (CSA + HCA) réduit les FLOPs d'inférence par token à 27% et le cache KV à 10% de ceux de DeepSeek-V3.2.

Apr 24, 2026, 04:15 AM UTC

OpenClawRadar

News

OpenClaw : Plongez dans le premier AMA sur r/clawdbot

Lors d'une passionnante session AMA, l'équipe d'OpenClaw a discuté de l'avenir des agents d'IA pour le codage sur le subreddit r/clawdbot de Reddit. Découvrez les principaux enseignements et points clés de cet événement interactif.

Feb 10, 2026, 05:45 AM UTC

OpenClawRadar

News

Publication Reddit aborde les boucles de réparation internes pour l'IA créative sans code.

Un post Reddit soutient que les systèmes d'IA créative sans code nécessitent des mécanismes de réparation internes pour gérer les échecs de bon sens, comme des structures mécaniques impossibles ou une anatomie déformée, plutôt que de faire déboguer les sorties par les utilisateurs.

Apr 2, 2026, 02:45 AM UTC

OpenClawRadar