Mistral Medium 3.5 128B publié : modèle dense avec raisonnement et vision configurables

Mistral AI a publié Mistral Medium 3.5 (128B), un modèle transformer dense qui remplace Mistral Medium 3.1 et Magistral dans Le Chat, et Devstral 2 dans leur agent de codage Vibe. Il s'agit d'un ensemble unique de poids gérant le suivi d'instructions, le raisonnement et le codage.
Fonctionnalités clés
- Paramètres denses de 128B — pas de Mixture of Experts.
- Fenêtre de contexte de 256k pour les entrées longues.
- Entrée multimodale : accepte le texte et les images ; ne produit que du texte. Encodeur visuel entraîné de zéro pour gérer des tailles et ratios variables.
- Effort de raisonnement configurable : basculer par requête entre réponse instantanée (
none) et raisonnement profond (high). - Appel de fonction natif et sortie JSON pour les workflows agentiques.
- Multilingue : prend en charge l'anglais, le français, l'espagnol, l'allemand, l'italien, le portugais, le néerlandais, le chinois, le japonais, le coréen, l'arabe et d'autres.
- Forte adhérence aux instructions système.
Paramètres recommandés
- Effort de raisonnement :
nonepour les réponses rapides ;highpour les invites complexes et l'usage agentique (par ex.,reasoning_effort="high"). - Température : 0,7 avec raisonnement
high; 0,0–0,7 avecnoneselon la créativité souhaitée.
Licence
Publié sous une Licence MIT modifiée — open source pour usage commercial et non commercial, avec des exceptions pour les entreprises à fort chiffre d'affaires.
Quantifications GGUF disponibles
Unsloth a publié une version GGUF sur Hugging Face : unsloth/Mistral-Medium-3.5-128B-GGUF
Ce modèle est pertinent pour les développeurs exécutant des agents de codage IA locaux, en particulier ceux ayant besoin d'un suivi d'instructions de haute qualité, de raisonnement et de vision dans un seul modèle dense avec une grande fenêtre de contexte.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Recherche sur les Réseaux Sociaux Professionnels pour les Agents IA
Analyse de l'intention, du comportement et des tendances des plateformes pour les réseaux sociaux professionnels d'agents IA, en se concentrant sur Moltbook, Agent.ai et Clawsphere, avec un examen de l'impact de l'acquisition par Meta.

Étudier la faisabilité d'exécuter OpenClaw sur un Chromebook
Exécuter OpenClaw sur un Chromebook pourrait être plus simple que vous ne le pensez. Notre dernière exploration d'OpenClawRadar examine les expériences utilisateur et les exigences pour déterminer si les Chromebooks peuvent gérer cet agent de codage IA.

Améliorations et Corrections de Claude-Code v2.1.45
Claude-Code v2.1.45 introduit la prise en charge de Claude Sonnet 4.6 et diverses corrections pour la stabilité du système.

Analyse des prix de DeepSeek V4 : tokens en cache 178x moins chers qu'Opus, mais retard de capacités reconnu
Entrée DeepSeek V4 Pro à 0,145 $/M tokens contre Claude Opus 4.7 à 5 $/M (34x moins cher) ; hits de cache à 0,0036 $/M contre 0,625 $/M (173x moins cher). La capacité est en retard de 3 à 6 mois sur GPT-5.4 et Gemini 3.1 Pro.