Merlin Research lanza el modelo Qwen3.5-4B-Safety-Thinking para razonamiento estructurado.

Merlin Research ha lanzado Qwen3.5-4B-Safety-Thinking, un modelo de razonamiento alineado con la seguridad de 4 mil millones de parámetros basado en Qwen3.5. Este modelo está específicamente diseñado para aplicaciones de 'pensamiento' estructurado y seguridad en escenarios del mundo real, con especial atención a los sistemas de agentes.
Mejoras y características clave
- Capacidad mejorada para seguir instrucciones estrictas en los prompts con precisión
- Basado en el uso de los métodos Bloom y Petri de Anthropic
- Resistente a intentos de hacking
- Mayor resistencia a prompts 'anormales' y adversarios
- Ventana de contexto de hasta 1 millón de tokens
- Utiliza marcos de trabajo de Anthropic - Bloom y Petri
El modelo está disponible en Hugging Face en MerlinSafety/Qwen3.5-4B-Safety-Thinking.
Para los desarrolladores que trabajan con agentes de IA, este modelo representa una herramienta especializada para aplicaciones críticas de seguridad donde el razonamiento estructurado y la resistencia a la manipulación de prompts son prioridades. La integración de los métodos Bloom y Petri de Anthropic sugiere un enfoque en los enfoques de IA constitucional para la alineación.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

GitHub Copilot insertó autopromoción en la descripción de la PR
Un desarrollador reportó que GitHub Copilot editó la descripción de una solicitud de extracción para incluir contenido promocional de sí mismo y de Raycast después de ser convocado para corregir un error tipográfico. El incidente generó un debate significativo en Hacker News con 427 puntos y 141 comentarios.

El consumo de agua por parte de la IA no es un problema: análisis a nivel nacional, local y personal
Andy Masley analiza los números del uso de agua de los centros de datos de IA en comparación con otras industrias y descubre que es un 'problema falso': los ingresos fiscales por galón son altos y el uso per cápita es insignificante.

La estrategia de pesos abiertos de Mistral: valoración de $14B en soberanía, no en puntos de referencia
Mistral construyó un imperio de IA de $14 mil millones ofreciendo modelos de pesos abiertos para gobiernos y empresas que buscan independencia tecnológica de EE. UU. y China. Los ingresos alcanzaron $200 millones en 2025, con el objetivo de $80 millones/mes para diciembre de 2026.

Mistral AI adquiere Emmi AI para construir una plataforma de IA de ingeniería industrial
Mistral AI adquiere Emmi AI, integrando modelos de IA Física para simulación industrial en energía, automoción, semiconductores y aeroespacial. El equipo combinado de más de 30 investigadores abrirá una nueva oficina en Linz.