Mistral Medium 3.5 128B Lanzado: Modelo Denso con Razonamiento y Visión Configurables

Mistral AI ha lanzado Mistral Medium 3.5 (128B), un modelo transformer denso que reemplaza a Mistral Medium 3.1 y Magistral en Le Chat, y a Devstral 2 en su agente de codificación Vibe. Es un conjunto único de pesos que maneja seguimiento de instrucciones, razonamiento y codificación.
Características clave
- Parámetros densos de 128B — no es Mixture of Experts.
- Ventana de contexto de 256k para entradas largas.
- Entrada multimodal: acepta texto e imágenes; solo genera texto. El codificador de visión se entrenó desde cero para manejar tamaños y relaciones de aspecto variables.
- Esfuerzo de razonamiento configurable: alternar por solicitud entre respuesta instantánea (
none) y razonamiento profundo (high). - Llamada a funciones nativa y salida JSON para flujos de trabajo de agentes.
- Multilingüe: admite inglés, francés, español, alemán, italiano, portugués, neerlandés, chino, japonés, coreano, árabe y otros.
- Fuerte adherencia a las instrucciones del sistema.
Configuración recomendada
- Esfuerzo de razonamiento:
nonepara respuestas rápidas;highpara solicitudes complejas y uso de agentes (p. ej.,reasoning_effort="high"). - Temperatura: 0.7 con razonamiento
high; 0.0–0.7 connonedependiendo de la creatividad deseada.
Licencia
Publicado bajo una Licencia MIT Modificada — código abierto para uso comercial y no comercial, con excepciones para empresas de grandes ingresos.
Disponibles cuantizaciones GGUF
Unsloth ha publicado una versión GGUF en Hugging Face: unsloth/Mistral-Medium-3.5-128B-GGUF
Este modelo es relevante para desarrolladores que ejecutan agentes de codificación de IA locales, particularmente aquellos que necesitan seguimiento de instrucciones de alta calidad, razonamiento y visión en un único modelo denso con una ventana de contexto grande.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

La Startup de IA de Yann LeCun Recauda $1,000 Millones en la Mayor Ronda Semilla de Europa.
La startup de IA de Yann LeCun ha recaudado 1.000 millones de dólares en lo que se informa como la ronda de financiación inicial más grande de Europa. La noticia fue compartida en Hacker News con 186 puntos y 107 comentarios.

Qwen3.5-122B en Blackwell SM120: Problema de Corrupción de Caché KV fp8 y Hallazgos de Rendimiento
Las pruebas de Qwen3.5-122B en hardware 8x RTX PRO 6000 Blackwell revelaron que la caché KV fp8_e4m3 produce silenciosamente salidas corruptas sin errores, requiriendo en su lugar caché KV bf16. La optimización MTP proporcionó una aceleración de 2.75x en solicitudes únicas, mientras que las restricciones de DeltaNet bloquearon otras optimizaciones.

Pantheon-Reasoning-27B: Un modelo de RP de razonamiento denso de Gryphe
Gryphe lanza Pantheon-Reasoning-27B, un ajuste fino sin censura de Qwen 3.6 27B con trazas de razonamiento completas para juegos de rol. Construido sobre datos de Pantheon, Opus-4.6-Reasoning-24k, WorldSim, aventuras de texto y RP general. Cuantizaciones GGUF disponibles.

La Plataforma Polsia Muestra Patrones Repetitivos de SaaS en Lanzamientos en Vivo de Fundadores
Polsia es una plataforma de negocios autónoma donde los usuarios describen su negocio, pagan dinero y se ejecuta de forma autónoma. Un científico del comportamiento observó 72 horas de lanzamientos en vivo de fundadores, identificando patrones repetitivos como soluciones de automatización de SDR con IA y mercados internacionales desatendidos.