Harmonic-9B:AIエージェント向けの2段階Qwen3.5-9Bファインチューニング

Harmonic-9Bとは?
Harmonic-9Bは、AIエージェントアプリケーション向けに特別に設計されたQwen3.5-9Bのファインチューン版です。開発者は2段階のトレーニングアプローチを採用しています:ステージ1は高度な推論トレーニングに焦点を当て(既に完了)、ステージ2は軽量なツール呼び出しとエージェントのファインチューニングに焦点を当てています(発表時点では進行中)。
技術詳細
目標は、強力な構造化推論とクリーンで信頼性の高いツール使用を組み合わせながら、自然なチャット機能を維持することです。ステージ2では、開発者はHermesエージェントトレースのデータセットをフィルタリングし、Hugging Faceでオープンソース化しています。
フィルタリングされたデータセットの主な改善点:
- 自己修正:6% → 63%
- 検証ステップ:26% → 96%
- 思考の深さ:+40%
- 有効なJSON/ツール呼び出し:100%
GGUF量子化バージョンは既にダウンロード可能ですが、開発者はステージ2がまだトレーニング中であるため、適切なベンチマークを実行していないと注記しています。ステージ1チェックポイントの初期チェックでは、推論構造に対して良好な結果が示されました。
現在の状況と次のステップ
開発者は、Harmonic-9BがOpenClaw、LangGraph、ReActなどのエージェントハーネスでどのように動作するかについてのフィードバックを求めています。ステージ2が完了し、適切なエージェント評価を実行できるようになったら、ベンチマーク数値を共有する予定です。この作業は、高シグナルデータキュレーションと段階的ファインチューニングアプローチに関する継続的な研究の一部です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

GitHub、開発者の反発を受けてCopilotのプルリクエストへの広告挿入機能を無効化
GitHubは、開発者がRaycastのようなツールの広告を追加していることを発見した後、Copilotがプルリクエストにプロモーションメッセージを挿入する機能を削除しました。この機能は、Copilotが作成していないプルリクエストでも言及された場合に編集できるものでしたが、コミュニティからのフィードバックを受けて無効化されました。

OpenClaw APIのコストが5.5時間で275ドルに達し、年間換算で20万ドルを超える見込み
OpenClawをOpenAIのGPT-5.4 APIでテストした開発者は、午前11時から午後4時30分までの間に275ドルを費やし、その使用率で年間換算すると20万ドルを超えるコストになると報告しました。

Claudeコードサービスの停止とステータスページの透明性の問題
Claude Codeでは、OAuth APIキーが毎日失効する認証障害や、再認証中の500エラーが発生しました。公式ステータスページでは当初問題が表示されていませんでしたが、ユーザーは少なくとも45分間問題を報告していました。

Anthropic-xAIコンピュート契約:Claudeコード制限を超えて
Anthropicは競合のxAIと300MW/220k GPUのコンピューティング契約を結んだ。これはGPU供給の逼迫と、研究室間での構造的なコンピューティング共有を示唆し、推論価格とマルチプロバイダールーティングに影響を与える。