mistral.rs Adiciona Suporte ao Gemma 4 12B: Multimodal, Agentivo e MTP

mistral.rs agora suporta o Gemma 4 12B com recursos multimodais, agentivos e de Previsão Multiturno (MTP). Esta versão inclui pesquisa web e execução de código em ambiente isolado para criar aplicações agentivas, além de entrada de áudio, imagem e vídeo.
Instalação
Instalação em linha única para Linux/macOS e Windows:
# Linux/macOS
curl --proto '=https' --tlsv1.2 -sSf https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh | sh
Windows
irm https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1 | iex
Executando com Agent & Quantização
Inicie um servidor HTTP compatível com OpenAI e Anthropic, com uma interface web integrada em localhost:1234/ui:
mistralrs run --agent -m google/gemma-4-12B-it --quant 4Habilitando MTP (Previsão Multiturno)
Para usar o MTP, adicione a flag --mtp-model com o modelo assistente:
mistralrs run --agent -m google/gemma-4-12B-it --quant 4 --mtp-model google/gemma-4-12B-it-assistantPrincipais Recursos
- Suporte multimodal completo: áudio, imagem e vídeo
- Pesquisa web e execução de código em ambiente isolado para fluxos agentivos
- Servidor HTTP compatível com OpenAI e Anthropic
- Interface de chat web integrada em
localhost:1234/ui
Para mais detalhes: GitHub | Documentação
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados
Savant Commander 48B é um modelo personalizado Qwen 3 Mixture-of-Experts com roteamento codificado manualmente que combina 12 modelos destilados de provedores como Claude, Gemini, OpenAI e Deepseek. Possui contexto de 256K e permite ativação controlada por prompt de modelos destilados específicos.

Plugin Claude Code para Campanhas de D&D Usando Rastreamento de Estado em Markdown
Um plugin do Claude Code usa arquivos markdown para acompanhar o estado da campanha e permite que o Claude atue como Mestre do Dungeon para sessões solo de D&D. O sistema é gratuito e de código aberto, exigindo instalação como plugin seguida do comando /claude-dnd:new-campaign para começar.

read-once: Um Gancho de Código do Claude que Evita Leituras Redundantes de Arquivos
Um desenvolvedor criou um hook PreToolUse chamado read-once que rastreia os arquivos que o Claude Code já leu em uma sessão, bloqueando releituras de arquivos inalterados e usando diffs para arquivos modificados. A ferramenta economiza milhares de tokens por sessão ao impedir que o Claude leia repetidamente o mesmo conteúdo de arquivo.

RUNE Protocol: Salve a Memória da Sessão de IA em Todas as Plataformas
RUNE (Notação Relacional do Usuário para Entidades) é um protocolo de código aberto que salva seu relacionamento com IA em um arquivo .rune criptografado, resolvendo o problema de inicialização a frio, onde assistentes de IA esquecem você entre sessões. Criado com Claude Opus 4.6, funciona nas plataformas Claude e GPT.