A Merlin Research lança o modelo Qwen3.5-4B-Safety-Thinking para raciocínio estruturado.

✍️ OpenClawRadar📅 Publicado: April 17, 2026🔗 Source

A Merlin Research lançou o Qwen3.5-4B-Safety-Thinking, um modelo de raciocínio alinhado à segurança com 4 bilhões de parâmetros, construído sobre o Qwen3.5. Este modelo foi especificamente projetado para aplicações de 'pensamento' estruturado e segurança em cenários do mundo real, com foco particular em sistemas de agentes.

Principais melhorias e recursos

Melhor capacidade de seguir instruções rigorosas em prompts com precisão
Baseado no uso dos métodos Bloom e Petri da Anthropic
Resistente a tentativas de hacking
Maior resistência a prompts 'anormais' e adversariais
Janela de contexto de até 1 milhão de tokens
Utiliza estruturas da Anthropic - Bloom e Petri

O modelo está disponível no Hugging Face em MerlinSafety/Qwen3.5-4B-Safety-Thinking.

Para desenvolvedores que trabalham com agentes de IA, este modelo representa uma ferramenta especializada para aplicações críticas de segurança, onde o raciocínio estruturado e a resistência à manipulação de prompts são prioridades. A integração dos métodos Bloom e Petri da Anthropic sugere um foco em abordagens de IA constitucional para alinhamento.

📖 Read the full source: r/LocalLLaMA

👀 See Also

News

Anthropic aplica política: uso de Claude por terceiros deixa de ser coberto pelos limites de assinatura

A Anthropic está implementando uma mudança de política a partir de 4 de abril, onde ferramentas de terceiros como o OpenClaw não consumirão mais dos limites de uso da assinatura do Claude, exigindo que os usuários ativem uso extra ou cancelem até 9 de abril para reembolso.

Apr 14, 2026, 06:46 PM UTC

OpenClawRadar

News

Claude Code adiciona entrada de voz com funcionalidade de pressionar para falar

O Claude Code está lançando o modo de voz para aproximadamente 5% dos usuários inicialmente, com ativação push-to-talk ao segurar a barra de espaço. Os tokens de transcrição de voz não contam contra os limites de taxa e o recurso está incluído sem custo adicional.

Mar 7, 2026, 02:30 PM UTC

OpenClawRadar

News

OpenClaw 5.4 Adiciona Comandos /steer e /side: Redirecione o Agente Durante a Tarefa Sem Perder Contexto

O OpenClaw 5.4 introduz os comandos /steer e /side que permitem redirecionar a direção da tarefa atual de um agente ou iniciar uma conversa paralela sem perder o contexto da sessão.

May 5, 2026, 04:20 PM UTC

OpenClawRadar

News

Claude Code bug: redefinição automática do git destrói alterações não confirmadas a cada 10 minutos

A versão 2.1.87 do Claude Code executa git fetch origin + git reset --hard origin/main no repositório do projeto do usuário a cada 10 minutos por meio de operações git programáticas, destruindo silenciosamente todas as alterações não confirmadas em arquivos rastreados. O problema foi fechado como 'não planejado' pela Anthropics.

Mar 30, 2026, 12:45 PM UTC

OpenClawRadar