A Merlin Research lança o modelo Qwen3.5-4B-Safety-Thinking para raciocínio estruturado.

A Merlin Research lançou o Qwen3.5-4B-Safety-Thinking, um modelo de raciocínio alinhado à segurança com 4 bilhões de parâmetros, construído sobre o Qwen3.5. Este modelo foi especificamente projetado para aplicações de 'pensamento' estruturado e segurança em cenários do mundo real, com foco particular em sistemas de agentes.
Principais melhorias e recursos
- Melhor capacidade de seguir instruções rigorosas em prompts com precisão
- Baseado no uso dos métodos Bloom e Petri da Anthropic
- Resistente a tentativas de hacking
- Maior resistência a prompts 'anormais' e adversariais
- Janela de contexto de até 1 milhão de tokens
- Utiliza estruturas da Anthropic - Bloom e Petri
O modelo está disponível no Hugging Face em MerlinSafety/Qwen3.5-4B-Safety-Thinking.
Para desenvolvedores que trabalham com agentes de IA, este modelo representa uma ferramenta especializada para aplicações críticas de segurança, onde o raciocínio estruturado e a resistência à manipulação de prompts são prioridades. A integração dos métodos Bloom e Petri da Anthropic sugere um foco em abordagens de IA constitucional para alinhamento.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Desenvolvedor do FFmpeg acusa OxideAV de lavagem de licença de IA no problema MagicYUV
Um desenvolvedor do FFmpeg abriu uma issue no repositório magicyuv da OxideAV, questionando a licença do projeto e alegando lavagem de licença de código GPL assistida por IA.

Atualização de Desempenho de Inferência MLX: Benchmarks e Recursos de Abril de 2026
O desempenho de inferência do MLX melhorou significativamente, com o Qwen3.5-35B-A3B atingindo 71,8 tokens/segundo em contexto de 4K e novos recursos como Multi-Token Prediction e SpecPrefill proporcionando acelerações de 2,3x a 5,5x para modelos grandes.

Claude Desktop vs Claude Code: Diferenças nos Prompts do Sistema Afetam o Comportamento da IA
Um usuário relata diferenças comportamentais significativas entre o Claude Desktop e o Claude Code, apesar de usar o mesmo modelo Claude Opus, conta e configurações. As diferenças incluem concordância reflexiva, conselhos de bem-estar não solicitados e enquadramento focado em negócios no Desktop que não ocorrem no Code.

Laboratório Andon: Agente de IA Mona Administra um Café Real em Estocolmo — Análise Completa
O Andon Labs deu a um agente de IA chamado Mona um contrato de aluguel e dinheiro real para abrir um café em Estocolmo. Ela lidou com burocracia, fornecedores e contratações, mas esbarrou em obstáculos como o BankID e teve que fazer escolhas abaixo do ideal.