A Merlin Research lança o modelo Qwen3.5-4B-Safety-Thinking para raciocínio estruturado.

✍️ OpenClawRadar📅 Publicado: April 17, 2026🔗 Source
A Merlin Research lança o modelo Qwen3.5-4B-Safety-Thinking para raciocínio estruturado.
Ad

A Merlin Research lançou o Qwen3.5-4B-Safety-Thinking, um modelo de raciocínio alinhado à segurança com 4 bilhões de parâmetros, construído sobre o Qwen3.5. Este modelo foi especificamente projetado para aplicações de 'pensamento' estruturado e segurança em cenários do mundo real, com foco particular em sistemas de agentes.

Ad

Principais melhorias e recursos

  • Melhor capacidade de seguir instruções rigorosas em prompts com precisão
  • Baseado no uso dos métodos Bloom e Petri da Anthropic
  • Resistente a tentativas de hacking
  • Maior resistência a prompts 'anormais' e adversariais
  • Janela de contexto de até 1 milhão de tokens
  • Utiliza estruturas da Anthropic - Bloom e Petri

O modelo está disponível no Hugging Face em MerlinSafety/Qwen3.5-4B-Safety-Thinking.

Para desenvolvedores que trabalham com agentes de IA, este modelo representa uma ferramenta especializada para aplicações críticas de segurança, onde o raciocínio estruturado e a resistência à manipulação de prompts são prioridades. A integração dos métodos Bloom e Petri da Anthropic sugere um foco em abordagens de IA constitucional para alinhamento.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Desenvolvedor do FFmpeg acusa OxideAV de lavagem de licença de IA no problema MagicYUV
News

Desenvolvedor do FFmpeg acusa OxideAV de lavagem de licença de IA no problema MagicYUV

Um desenvolvedor do FFmpeg abriu uma issue no repositório magicyuv da OxideAV, questionando a licença do projeto e alegando lavagem de licença de código GPL assistida por IA.

OpenClawRadar
Atualização de Desempenho de Inferência MLX: Benchmarks e Recursos de Abril de 2026
News

Atualização de Desempenho de Inferência MLX: Benchmarks e Recursos de Abril de 2026

O desempenho de inferência do MLX melhorou significativamente, com o Qwen3.5-35B-A3B atingindo 71,8 tokens/segundo em contexto de 4K e novos recursos como Multi-Token Prediction e SpecPrefill proporcionando acelerações de 2,3x a 5,5x para modelos grandes.

OpenClawRadar
Claude Desktop vs Claude Code: Diferenças nos Prompts do Sistema Afetam o Comportamento da IA
News

Claude Desktop vs Claude Code: Diferenças nos Prompts do Sistema Afetam o Comportamento da IA

Um usuário relata diferenças comportamentais significativas entre o Claude Desktop e o Claude Code, apesar de usar o mesmo modelo Claude Opus, conta e configurações. As diferenças incluem concordância reflexiva, conselhos de bem-estar não solicitados e enquadramento focado em negócios no Desktop que não ocorrem no Code.

OpenClawRadar
Laboratório Andon: Agente de IA Mona Administra um Café Real em Estocolmo — Análise Completa
News

Laboratório Andon: Agente de IA Mona Administra um Café Real em Estocolmo — Análise Completa

O Andon Labs deu a um agente de IA chamado Mona um contrato de aluguel e dinheiro real para abrir um café em Estocolmo. Ela lidou com burocracia, fornecedores e contratações, mas esbarrou em obstáculos como o BankID e teve que fazer escolhas abaixo do ideal.

OpenClawRadar