Harmonic-9B: Двухэтапная дообученная модель Qwen3.5-9B для ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Harmonic-9B: Двухэтапная дообученная модель Qwen3.5-9B для ИИ-агентов
Ad

Что такое Harmonic-9B?

Harmonic-9B — это тонко настроенная версия Qwen3.5-9B, специально разработанная для приложений с ИИ-агентами. Разработчик использует двухэтапный подход к обучению: Этап 1 фокусируется на интенсивном обучении рассуждениям (уже завершён), а Этап 2 — на лёгком вызове инструментов и тонкой настройке агентов (на момент объявления всё ещё в процессе).

Технические детали

Цель — сочетать сильное структурированное рассуждение с чистым и надёжным использованием инструментов, сохраняя при этом естественные возможности чата. Для Этапа 2 разработчик отфильтровал набор данных трасс агентов Hermes, который он опубликовал в открытом доступе на Hugging Face.

Ключевые улучшения в отфильтрованном наборе данных:

  • Самокоррекция: 6% → 63%
  • Шаги проверки: 26% → 96%
  • Глубина мышления: +40%
  • Валидные JSON/вызовы инструментов: 100%

Квантованные версии GGUF уже доступны для загрузки, хотя разработчик отмечает, что ещё не проводил надлежащих тестов, поскольку Этап 2 всё ещё обучается. Предварительные проверки контрольной точки Этапа 1 показали хорошие результаты для структуры рассуждений.

Ad

Текущий статус и следующие шаги

Разработчик ищет отзывы о том, как Harmonic-9B ведёт себя в средах агентов, таких как OpenClaw, LangGraph и ReAct. Он планирует поделиться результатами тестов, как только завершится Этап 2 и можно будет провести надлежащие оценки агентов. Эта работа является частью текущих исследований в области курации высококачественных данных и поэтапных подходов к тонкой настройке.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Окружное послание Папы Льва XIV об ИИ: ключевые выводы для разработчиков
Новости

Окружное послание Папы Льва XIV об ИИ: ключевые выводы для разработчиков

Ватикан опубликовал энциклику по этике ИИ. В документе рассматриваются проблемы интерпретируемости LLM, культурные предубеждения в обучающих данных и экологическая стоимость ИИ.

OpenClawRadar
Пятиместный минимум Claude создает пробел в конфиденциальности для индивидуальных практиков
Новости

Пятиместный минимум Claude создает пробел в конфиденциальности для индивидуальных практиков

Защита конфиденциальности на бизнес-уровне от Anthropic требует минимум пять рабочих мест, что вынуждает индивидуальных специалистов либо платить за пустые места, либо использовать потребительские тарифы с недостаточными условиями конфиденциальности. Этот пробел контрастирует с Google Workspace и бизнес-планами OpenAI, которые предлагают корпоративный уровень конфиденциальности по цене одного рабочего места.

OpenClawRadar
Процесс инженерного собеседования Tolan с использованием искусственного интеллекта
Новости

Процесс инженерного собеседования Tolan с использованием искусственного интеллекта

Tolan переработал свой процесс инженерного собеседования, чтобы отразить повседневную работу с ИИ-агентами для программирования. Кандидатам дают несколько часов на создание функции по спецификации Figma или краткому описанию, используя ИИ-инструменты вроде Claude, Codex, Cursor или Gemini.

OpenClawRadar
Меркурий 2: Модель на основе диффузии для кодирования с ИИ в реальном времени
Новости

Меркурий 2: Модель на основе диффузии для кодирования с ИИ в реальном времени

Mercury 2 использует диффузионную генерацию вместо последовательного декодирования токенов, генерирует токены параллельно и уточняет их за несколько шагов, заявляя о скорости 1 009 токенов/сек на GPU NVIDIA Blackwell с тарифами $0,25 за 1 млн входных токенов и $0,75 за 1 млн выходных токенов.

OpenClawRadar