Qwen 3.5 Plantilla de Chat Lanzada con 21 Correcciones de Errores para Flujos de Trabajo de Agentes

Un desarrollador ha lanzado una plantilla de chat parcheada para los modelos Qwen 3.5, corrigiendo 21 errores encontrados durante flujos de trabajo de agentes. Este es un reemplazo directo para la plantilla oficial, que solo requiere intercambiar el archivo chat_template.jinja.
Correcciones Clave
El desarrollador ejecutó específicamente Qwen 3.5 35B para flujos de trabajo de agentes y abordó los siguientes problemas principales:
- Fallo en Llamada a Herramienta: Corrigió un fallo relacionado con
arguments | items(referenciado como discusión HF #4). - Fuga de Bloque Herramienta/Pensamiento: El contenido de
<tool_call>ya no se filtra en bloques<think>, con desactivación automática del pensamiento cuando las herramientas están activas. - Llamadas Paralelas a Herramientas: Las llamadas ahora están correctamente separadas con delimitadores
\n\n. - Bucles Profundos de Agente: Previene fallos después de 5 o más saltos de herramienta.
- Manejo de Roles Desconocidos: Roles como 'planner' y 'critic' ahora retroceden con gracia en lugar de causar un fallo.
- Analizadores de Transmisión: Proporciona límites XML limpios para transmisión.
- Truncamiento Configurable: Permite establecer un límite máximo de caracteres para argumentos y respuestas de herramientas grandes.
- Soporte para Rol de Desarrollador: Añade soporte para roles como 'Claude Code', 'Codex' y 'OpenCode'.
Una lista completa de las 21 correcciones está disponible en el README del proyecto.
Configuración
La plantilla incluye variables configurables. Se pueden establecer mediante argumentos de línea de comandos:
--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'
Compatibilidad y Pruebas
La plantilla ha sido probada en las siguientes plataformas con las versiones mínimas especificadas:
- llama.cpp (b4242+)
- Open WebUI (v0.4.8+)
- vLLM (v0.6.4+)
- Ollama (v0.5.0+)
- LM Studio (v0.3.5+)
- Text Generation WebUI
Es compatible con todos los modelos Qwen 3.5 (35B, 27B, 14B, 9B, 4B y la serie Coder) y es retrocompatible con Qwen3 32B.
Source y Licencia
La plantilla está disponible para descargar en HuggingFace en barubary/qwen3.5-barubary-attuned-chat-template. Se publica bajo la licencia Apache 2.0, y el desarrollador agradece comentarios e informes de errores.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Jeeves: Interfaz de Usuario de Texto para Navegar y Reanudar Sesiones de Agentes de IA
Jeeves es una interfaz de usuario de terminal que te permite buscar, previsualizar y reanudar sesiones de agentes de IA desde Claude Code, Codex y OpenCode en una sola vista. Está escrito en Go y está disponible a través de múltiples gestores de paquetes, incluyendo Homebrew, Nix y Go install.

Usando Claude Code para revitalizar proyectos personales abandonados: una guía práctica
Matthew Brunelle comparte cómo usó Claude Code (con Opus 4.6) para resucitar un proyecto de shim entre YouTube Music y la API de OpenSubsonic que estaba estancado, incluyendo pasos de configuración, indicaciones y consejos de flujo de trabajo.

Exportando Memorias de Agentes de IA Usando la Función de Importación de Claude
Un usuario de Reddit comparte un mensaje para extraer recuerdos almacenados de agentes de IA como ChatGPT y Claude, y luego importarlos a OpenClaw. El mensaje solicita todo el contexto almacenado, incluyendo instrucciones, detalles personales, proyectos, herramientas y preferencias.

Auto Router vs Sonnet: Ahorro de Costos vs Calidad de Respuesta
La función Auto Router de Open Router selecciona dinámicamente modelos de lenguaje según la complejidad del contexto, ofreciendo ahorros significativos de costos (0.8 centavos vs 0.00071 centavos por solicitud), pero los usuarios reportan una calidad de respuesta degradada en comparación con Sonnet 4.6.