Qwen 3.5 Chat: 21 Correções de Bugs para Agentes

Um desenvolvedor lançou um modelo de chat corrigido para os modelos Qwen 3.5, corrigindo 21 bugs encontrados durante fluxos de trabalho de agentes. Esta é uma substituição direta para o modelo oficial, exigindo apenas a troca do arquivo chat_template.jinja.

Principais Correções

O desenvolvedor executou especificamente o Qwen 3.5 35B para fluxos de trabalho de agentes e abordou os seguintes problemas principais:

Falha na Chamada de Ferramenta: Corrigida uma falha relacionada a arguments | items (referenciada como discussão HF #4).
Vazamento do Bloco Ferramenta/Pensamento: O conteúdo de <tool_call> não vaza mais para blocos <think>, com desativação automática do pensamento quando as ferramentas estão ativas.
Chamadas de Ferramentas Paralelas: As chamadas agora são adequadamente separadas com delimitadores \n\n.
Loops Profundos de Agentes: Impede falhas após 5+ saltos de ferramenta.
Tratamento de Função Desconhecida: Funções como 'planejador' e 'crítico' agora retornam graciosamente em vez de causar uma falha.
Analisadores de Transmissão: Fornece limites XML limpos para transmissão.
Truncação Configurável: Permite definir um limite máximo de caracteres para argumentos e respostas de ferramentas grandes.
Suporte à Função de Desenvolvedor: Adiciona suporte para funções como 'Claude Code', 'Codex' e 'OpenCode'.

Uma lista completa de todas as 21 correções está disponível no README do projeto.

Configuração

O modelo inclui variáveis configuráveis. Elas podem ser definidas por meio de argumentos de linha de comando:

--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'

Compatibilidade e Testes

O modelo foi testado nas seguintes plataformas com as versões mínimas especificadas:

llama.cpp (b4242+)
Open WebUI (v0.4.8+)
vLLM (v0.6.4+)
Ollama (v0.5.0+)
LM Studio (v0.3.5+)
Text Generation WebUI

É compatível com todos os modelos Qwen 3.5 (35B, 27B, 14B, 9B, 4B e a série Coder) e é retrocompatível com o Qwen3 32B.

Source e Licença

O modelo está disponível para download no HuggingFace em barubary/qwen3.5-barubary-attuned-chat-template. É lançado sob a licença Apache 2.0, e o desenvolvedor agradece feedback e relatórios de bugs.

📖 Read the full source: r/LocalLLaMA

Lançamento do Modelo Qwen 3.5 Chat com 21 Correções de Bugs para Fluxos de Trabalho de Agentes

Principais Correções

Configuração

Compatibilidade e Testes

Source e Licença

👀 See Also

Estagiário de física da Hugging Face: Framework multiagente dobra Gemini no benchmark CritPt

Logira: Auditoria de Runtime eBPF para Execuções de Agentes de IA

Referência: MLX vs Ollama Executando Qwen3-Coder-Next 8-Bit no MacBook Pro M5 Max

Desenvolvedor Cria Habilidade de IA de Código Aberto para Validar Ideias de Startups e Mata a Própria Ideia em 10 Minutos