Lançamento do Modelo Qwen 3.5 Chat com 21 Correções de Bugs para Fluxos de Trabalho de Agentes

Um desenvolvedor lançou um modelo de chat corrigido para os modelos Qwen 3.5, corrigindo 21 bugs encontrados durante fluxos de trabalho de agentes. Esta é uma substituição direta para o modelo oficial, exigindo apenas a troca do arquivo chat_template.jinja.
Principais Correções
O desenvolvedor executou especificamente o Qwen 3.5 35B para fluxos de trabalho de agentes e abordou os seguintes problemas principais:
- Falha na Chamada de Ferramenta: Corrigida uma falha relacionada a
arguments | items(referenciada como discussão HF #4). - Vazamento do Bloco Ferramenta/Pensamento: O conteúdo de
<tool_call>não vaza mais para blocos<think>, com desativação automática do pensamento quando as ferramentas estão ativas. - Chamadas de Ferramentas Paralelas: As chamadas agora são adequadamente separadas com delimitadores
\n\n. - Loops Profundos de Agentes: Impede falhas após 5+ saltos de ferramenta.
- Tratamento de Função Desconhecida: Funções como 'planejador' e 'crítico' agora retornam graciosamente em vez de causar uma falha.
- Analisadores de Transmissão: Fornece limites XML limpos para transmissão.
- Truncação Configurável: Permite definir um limite máximo de caracteres para argumentos e respostas de ferramentas grandes.
- Suporte à Função de Desenvolvedor: Adiciona suporte para funções como 'Claude Code', 'Codex' e 'OpenCode'.
Uma lista completa de todas as 21 correções está disponível no README do projeto.
Configuração
O modelo inclui variáveis configuráveis. Elas podem ser definidas por meio de argumentos de linha de comando:
--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'
Compatibilidade e Testes
O modelo foi testado nas seguintes plataformas com as versões mínimas especificadas:
- llama.cpp (b4242+)
- Open WebUI (v0.4.8+)
- vLLM (v0.6.4+)
- Ollama (v0.5.0+)
- LM Studio (v0.3.5+)
- Text Generation WebUI
É compatível com todos os modelos Qwen 3.5 (35B, 27B, 14B, 9B, 4B e a série Coder) e é retrocompatível com o Qwen3 32B.
Source e Licença
O modelo está disponível para download no HuggingFace em barubary/qwen3.5-barubary-attuned-chat-template. É lançado sob a licença Apache 2.0, e o desenvolvedor agradece feedback e relatórios de bugs.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Gênese do Livro de Código Aberto: 20 Habilidades de Código Claude para Escrita Autônoma de Livros
Book Genesis é um sistema de código aberto com 20 habilidades especializadas do Claude Code que pega uma ideia de livro e produz um manuscrito completo e pronto para publicação através de um pipeline autônomo de 14 fases. Inclui um 'Motor do Caos' para quebrar padrões de previsibilidade da IA e gerou uma memória de 68.000 palavras que obteve 9,0/10 na sua Pontuação Genesis.

Black LLAB: Arquitetura de Código Aberto para Roteamento Dinâmico de Modelos e Agentes de IA em Sandbox Docker
Um desenvolvedor disponibilizou em código aberto o Black LLAB, um sistema que utiliza o Mistral 3B para direcionar prompts entre modelos locais e na nuvem e executa agentes de IA em contêineres Docker isolados com integração OpenClaw.

Altimate Code: Plataforma de Engenharia de Dados Agêntica de Código Aberto
Altimate Code é um harness de código aberto que fornece ferramentas determinísticas de engenharia de dados para agentes de IA, abordando problemas como SQL alucinado e falta de contexto de esquema. Inclui linhagem em nível de coluna, detecção de antipadrões SQL e integração com dbt, com benchmarks mostrando 74,4% de desempenho no ADE-bench.

BuddyBoard: Um Ranking Competitivo para o Recurso /buddy do Claude Code
BuddyBoard é uma ferramenta construída pela comunidade que cria um placar competitivo para o recurso /buddy do Claude Code, gerando cartas colecionáveis com estatísticas, níveis de raridade e um BuddyDex que rastreia 1.728 combinações possíveis. Execute com npx buddy-board para enviar seu buddy para o ranking global.