Выпущена модель Mistral Medium 3.5 128B: плотная модель с настраиваемым рассуждением и зрением

Mistral AI выпустила Mistral Medium 3.5 (128B) — плотную модель-трансформер, которая заменяет Mistral Medium 3.1 и Magistral в Le Chat, а также Devstral 2 в их агенте для кодирования Vibe. Это единый набор весов, который обрабатывает выполнение инструкций, рассуждения и кодирование.
Ключевые особенности
- Плотные 128B параметров — не смесь экспертов.
- Контекстное окно 256k для длинных входных данных.
- Мультимодальный ввод: принимает текст и изображения; выводит только текст. Кодировщик изображений обучен с нуля для работы с переменными размерами и соотношениями сторон.
- Настраиваемый уровень рассуждений: переключение между мгновенным ответом (
none) и глубокими рассуждениями (high) для каждого запроса. - Встроенный вызов функций и вывод JSON для агентских рабочих процессов.
- Многоязычность: поддерживает английский, французский, испанский, немецкий, итальянский, португальский, нидерландский, китайский, японский, корейский, арабский и другие.
- Строгое следование системным подсказкам.
Рекомендуемые настройки
- Уровень рассуждений:
noneдля быстрых ответов;highдля сложных запросов и агентского использования (например,reasoning_effort="high"). - Температура: 0.7 с
highрассуждением; 0.0–0.7 сnoneв зависимости от желаемой креативности.
Лицензия
Выпущена под модифицированной лицензией MIT — с открытым исходным кодом для коммерческого и некоммерческого использования, за исключением компаний с большим доходом.
Доступны GGUF-квантования
Unsloth опубликовал версию GGUF на Hugging Face: unsloth/Mistral-Medium-3.5-128B-GGUF
Эта модель актуальна для разработчиков, запускающих локальные AI-агенты кодирования, особенно тех, кому нужно качественное следование инструкциям, рассуждения и работа с изображениями в одной плотной модели с большим контекстным окном.
📖 Читать источник: r/LocalLLaMA
👀 Смотрите также

Вибрационное кодирование против агентной инженерии: размытые границы становятся неудобными
Саймон Уиллисон размышляет о том, как виб-кодинг и агентная инженерия сходятся в его рабочем процессе, отмечая, что теперь он доверяет Claude Code писать продакшн-эндпоинты JSON API без проверки каждой строки — и это кажется странным.

Антропный Клод проводит 80 тысяч структурированных интервью в качестве альтернативы опросам.
Anthropic использовала Claude для проведения структурированных интервью с примерно 80 000 пользователей из более чем 150 стран и 70+ языков, при этом языковая модель выступала как в роли интервьюера, так и аналитика для сбора разговорных данных.

Утечка исходного кода Claude раскрывает защиту от дистилляции, режим под прикрытием и обнаружение фрустрации
Утечка файла карты исходного кода из npm-пакета Claude Code раскрывает методы противодистилляции с использованием фейковых инструментов, режим «под прикрытием», скрывающий авторство ИИ, и обнаружение фрустрации через регулярные выражения.

Claude Sonnet 4.6 превосходит Opus 4.6 по выполнению в бенчмарке промптов
Пользователь Reddit отправил сложный запрос обеим моделям Sonnet 4.6 и Opus 4.6; модель Sonnet показала лучший результат по критериям креативности и скрытых требований.