Harmonic-9B: Двухэтапная дообученная модель Qwen3.5-9B для агентов

Что такое Harmonic-9B?

Harmonic-9B — это тонко настроенная версия Qwen3.5-9B, специально разработанная для приложений с ИИ-агентами. Разработчик использует двухэтапный подход к обучению: Этап 1 фокусируется на интенсивном обучении рассуждениям (уже завершён), а Этап 2 — на лёгком вызове инструментов и тонкой настройке агентов (на момент объявления всё ещё в процессе).

Технические детали

Цель — сочетать сильное структурированное рассуждение с чистым и надёжным использованием инструментов, сохраняя при этом естественные возможности чата. Для Этапа 2 разработчик отфильтровал набор данных трасс агентов Hermes, который он опубликовал в открытом доступе на Hugging Face.

Ключевые улучшения в отфильтрованном наборе данных:

Самокоррекция: 6% → 63%
Шаги проверки: 26% → 96%
Глубина мышления: +40%
Валидные JSON/вызовы инструментов: 100%

Квантованные версии GGUF уже доступны для загрузки, хотя разработчик отмечает, что ещё не проводил надлежащих тестов, поскольку Этап 2 всё ещё обучается. Предварительные проверки контрольной точки Этапа 1 показали хорошие результаты для структуры рассуждений.

Текущий статус и следующие шаги

Разработчик ищет отзывы о том, как Harmonic-9B ведёт себя в средах агентов, таких как OpenClaw, LangGraph и ReAct. Он планирует поделиться результатами тестов, как только завершится Этап 2 и можно будет провести надлежащие оценки агентов. Эта работа является частью текущих исследований в области курации высококачественных данных и поэтапных подходов к тонкой настройке.

📖 Read the full source: r/LocalLLaMA

Harmonic-9B: Двухэтапная дообученная модель Qwen3.5-9B для ИИ-агентов

Что такое Harmonic-9B?

Технические детали

Текущий статус и следующие шаги

👀 Смотрите также

Опус 4.6: Расширенное мышление демонстрирует худшие результаты в задачах с физическими диаграммами.

Claude AI тратит 81 минуту на «настоящее мышление» – скачки пользовательских отчетов вокруг крупных обновлений

API Claude столкнулась с повышенным уровнем ошибок в работе нескольких моделей 25 февраля 2026 года.

Когнитивный долг: когда результаты ИИ опережают понимание