Выпуск шаблона Qwen 3.5 Chat с 21 исправлением ошибок для рабочих процессов агентов

Разработчик выпустил исправленный шаблон чата для моделей Qwen 3.5, устранив 21 ошибку, обнаруженную при работе с агентскими процессами. Это прямая замена официального шаблона, требующая только замены файла chat_template.jinja.
Ключевые исправления
Разработчик специально запускал Qwen 3.5 35B для агентских процессов и устранил следующие основные проблемы:
- Сбой при вызове инструментов: Исправлен сбой, связанный с
arguments | items(упоминается в обсуждении HF #4). - Утечка блока инструментов/размышлений: Содержимое
<tool_call>больше не просачивается в блоки<think>, с автоматическим отключением размышлений при активных инструментах. - Параллельные вызовы инструментов: Вызовы теперь правильно разделены разделителями
\n\n. - Глубокие циклы агента: Предотвращает сбои после 5+ переходов между инструментами.
- Обработка неизвестных ролей: Роли, такие как 'planner' и 'critic', теперь корректно переключаются на резервный режим вместо вызова сбоя.
- Потоковые парсеры: Обеспечивает чистые XML-границы для потоковой обработки.
- Настраиваемое усечение: Позволяет установить максимальный лимит символов для больших аргументов инструментов и ответов.
- Поддержка роли разработчика: Добавляет поддержку ролей, таких как 'Claude Code', 'Codex' и 'OpenCode'.
Полный список всех 21 исправлений доступен в файле README проекта.
Конфигурация
Шаблон включает настраиваемые переменные. Их можно задать через аргументы командной строки:
--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'
Совместимость и тестирование
Шаблон был протестирован на следующих платформах с указанными минимальными версиями:
- llama.cpp (b4242+)
- Open WebUI (v0.4.8+)
- vLLM (v0.6.4+)
- Ollama (v0.5.0+)
- LM Studio (v0.3.5+)
- Text Generation WebUI
Он совместим со всеми моделями Qwen 3.5 (35B, 27B, 14B, 9B, 4B и серией Coder) и обратно совместим с Qwen3 32B.
Источник и лицензия
Шаблон доступен для загрузки на HuggingFace по адресу barubary/qwen3.5-barubary-attuned-chat-template. Он выпущен под лицензией Apache 2.0, и разработчик приветствует отзывы и сообщения об ошибках.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также
Tendril: Самодействующий агент, создающий и регистрирующий инструменты на лету
Tendril — это агентная песочница, которая автономно находит, создает и регистрирует инструменты. Она начинается всего с трех базовых инструментов и динамически расширяет свой реестр возможностей без участия пользователя.

Клод как компилятор: Практический пересмотр подхода к разработке ИИ
В посте на Reddit утверждается, что Claude Code функционирует как компилятор, переводящий английский язык в работающее программное обеспечение, проводя параллели с историческими прорывами в вычислительной технике, такими как A-0 Грейс Хоппер и FORTRAN. Автор описывает генерацию 400 строк кода в 6 файлах из трёх абзацев описания на английском, обнаружив две проблемы за 25 минут.

Мнемос: Открытый локально-первичный слой памяти для кодирующих агентов
Mnemos — это локально-ориентированный слой памяти для рабочих процессов солитарных кодирующих агентов, который решает распространённые проблемы систем памяти, такие как утечка контекста, устаревшие данные и неограниченный рост транскриптов. Публичная бета-версия включает стартовые профили SQLite, поддержку MCP для Claude Code/Desktop и биомиметический конвейер с компонентами SurprisalGate и MutableRAG.

Расширение RelayCode для VS Code направляет код Claude через суверенные RDU.
OpenGPU выпустила RelayCode — расширение для VS Code, которое работает как локальный прокси для маршрутизации запросов от Claude Code или Copilot через их децентрализованную сеть к открытым моделям, таким как DeepSeek-R1 и MiniMax M2.5, работающим на суверенных реконфигурируемых блоках потоковой обработки данных.