Le mistral.rs ajoute le support de Gemma 4 12B : multimodal, agentique et MTP

mistral.rs supporte désormais Gemma 4 12B avec des fonctionnalités multimodales, agentiques et de prédiction multi-tour (MTP). Cette version inclut la recherche web et l'exécution de code en sandbox pour créer des applications agentiques, ainsi que l'entrée audio, image et vidéo.
Installation
Installation en une ligne pour Linux/macOS et Windows :
# Linux/macOS
curl --proto '=https' --tlsv1.2 -sSf https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh | sh
Windows
irm https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1 | iex
Exécution avec Agent et Quantification
Lancez un serveur HTTP compatible OpenAI et Anthropic avec une interface web intégrée à localhost:1234/ui :
mistralrs run --agent -m google/gemma-4-12B-it --quant 4Activation de MTP (Multi-Turn Prediction)
Pour utiliser MTP, ajoutez le flag --mtp-model avec le modèle assistant :
mistralrs run --agent -m google/gemma-4-12B-it --quant 4 --mtp-model google/gemma-4-12B-it-assistantFonctionnalités clés
- Support multimodal complet : audio, image et vidéo
- Recherche web et exécution de code en sandbox pour des workflows agentiques
- Serveur HTTP compatible OpenAI et Anthropic
- Interface de chat web intégrée à
localhost:1234/ui
Pour plus de détails : GitHub | Documentation
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Antigravité 2.0 domine le benchmark architectural 3D OpenSCAD – ModelRift teste 6 LLM sur le Panthéon
ModelRift a testé 6 LLM pour construire le Panthéon en OpenSCAD. Antigravity a obtenu 4,5/5 en qualité architecturale, battant le baseline Codex 5.5. Cursor 3.5 était le plus rapide mais le plus faible.

Heddle : Application de la confiance et journalisation des audits pour les connexions MCP de Claude Desktop
Heddle est un outil open source qui ajoute des niveaux de confiance, des contrôles d'accès et une journalisation d'audit aux connexions MCP de Claude Desktop, permettant une gestion sécurisée de multiples services via une interface unique avec six packs de démarrage inclus.

Le modèle MoE Local 35B réduit le taux d'échec du code de l'OS Agent à 0%
Un développeur rapporte que le passage d'un système multi-agents à Qwen 3.6 35B A3B (MoE, 3B paramètres actifs) a éliminé les échecs de code, atteignant un taux de réussite de 100 % grâce à une porte de validation à 5 niveaux.

Mémoire gustative : Mémoire réversible d'agent via des vecteurs de calcul hyperdimensionnel
L'informatique hyperdimensionnelle remplace la recherche vectorielle pour une mémoire complète : lister TOUS les jours touchant un projet, détecter les flux de travail sans nom et décomposer les journaux quotidiens sans perte via des produits scalaires.