Merlin Research lanza el modelo Qwen3.5-4B-Safety-Thinking para razonamiento estructurado.

✍️ OpenClawRadar📅 Publicado: 17 de abril de 2026🔗 Source

Merlin Research ha lanzado Qwen3.5-4B-Safety-Thinking, un modelo de razonamiento alineado con la seguridad de 4 mil millones de parámetros basado en Qwen3.5. Este modelo está específicamente diseñado para aplicaciones de 'pensamiento' estructurado y seguridad en escenarios del mundo real, con especial atención a los sistemas de agentes.

Mejoras y características clave

Capacidad mejorada para seguir instrucciones estrictas en los prompts con precisión
Basado en el uso de los métodos Bloom y Petri de Anthropic
Resistente a intentos de hacking
Mayor resistencia a prompts 'anormales' y adversarios
Ventana de contexto de hasta 1 millón de tokens
Utiliza marcos de trabajo de Anthropic - Bloom y Petri

El modelo está disponible en Hugging Face en MerlinSafety/Qwen3.5-4B-Safety-Thinking.

Para los desarrolladores que trabajan con agentes de IA, este modelo representa una herramienta especializada para aplicaciones críticas de seguridad donde el razonamiento estructurado y la resistencia a la manipulación de prompts son prioridades. La integración de los métodos Bloom y Petri de Anthropic sugiere un enfoque en los enfoques de IA constitucional para la alineación.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Noticias

Usuarios de OpenRouter reportan bug de firma invalida en bloques de pensamiento de Sonnet 4.5

Un bug que afecta el modo de pensamiento extendido de Claude Sonnet 4.5 via OpenRouter causa fallos de validacion de firma.

7 feb 2026, 20:34 UTC

OpenClaw Radar

Noticias

Mercurio 2: Modelo Basado en Difusión para Codificación con IA en Tiempo Real

Mercury 2 utiliza generación basada en difusión en lugar de decodificación secuencial token por token, genera tokens en paralelo y los refina a lo largo de pasos, y afirma 1,009 tokens/seg en GPUs NVIDIA Blackwell con precios de $0.25/1M tokens de entrada y $0.75/1M tokens de salida.

25 feb 2026, 23:45 UTC

OpenClawRadar

Noticias

El costo oculto del código generado por IA: depurar espagueti

Una publicación de Reddit captura la realidad de enviar código generado por IA rápidamente, para luego pasar semanas depurando funciones hinchadas, errores de estado nulo y nombres de variables crípticos.

7 may 2026, 08:17 UTC

OpenClawRadar

Noticias

Competencia de Proteómica de Bohrium AI 2026 con Premio de $13K y Soporte de Computación

Bohrium está organizando una competencia de proteómica con IA en 2026 con un premio de $13,000, oportunidades de pasantías y soporte de cómputo. La competencia fue discutida en Hacker News con 17 puntos y 5 comentarios.

28 mar 2026, 12:45 UTC

OpenClawRadar