Harmonic-9B: Qwen3.5-9B 2段階ファインチューニング

Harmonic-9Bとは？

Harmonic-9Bは、AIエージェントアプリケーション向けに特別に設計されたQwen3.5-9Bのファインチューン版です。開発者は2段階のトレーニングアプローチを採用しています：ステージ1は高度な推論トレーニングに焦点を当て（既に完了）、ステージ2は軽量なツール呼び出しとエージェントのファインチューニングに焦点を当てています（発表時点では進行中）。

技術詳細

目標は、強力な構造化推論とクリーンで信頼性の高いツール使用を組み合わせながら、自然なチャット機能を維持することです。ステージ2では、開発者はHermesエージェントトレースのデータセットをフィルタリングし、Hugging Faceでオープンソース化しています。

フィルタリングされたデータセットの主な改善点：

自己修正：6% → 63%
検証ステップ：26% → 96%
思考の深さ：+40%
有効なJSON/ツール呼び出し：100%

GGUF量子化バージョンは既にダウンロード可能ですが、開発者はステージ2がまだトレーニング中であるため、適切なベンチマークを実行していないと注記しています。ステージ1チェックポイントの初期チェックでは、推論構造に対して良好な結果が示されました。

現在の状況と次のステップ

開発者は、Harmonic-9BがOpenClaw、LangGraph、ReActなどのエージェントハーネスでどのように動作するかについてのフィードバックを求めています。ステージ2が完了し、適切なエージェント評価を実行できるようになったら、ベンチマーク数値を共有する予定です。この作業は、高シグナルデータキュレーションと段階的ファインチューニングアプローチに関する継続的な研究の一部です。

📖 Read the full source: r/LocalLLaMA

Harmonic-9B：AIエージェント向けの2段階Qwen3.5-9Bファインチューニング

Harmonic-9Bとは？

技術詳細

現在の状況と次のステップ

👀 See Also

Apple IntelligenceとSiri AI：視覚インテリジェンスとライティングツールで再定義されたアシスタント

Redditの投稿では、ノーコードのクリエイティブAIの内部修復ループについて議論されています。

Claude for ExcelおよびPowerPointの更新：アプリケーション間のコンテキストとスキル統合

研究：AI智能体在重复性工作负荷下表现出马克思主义观点