Harmonic-9B: Zweistufiges Qwen3.5-9B Finetuning für KI-Agenten

Was ist Harmonic-9B?

Harmonic-9B ist eine feinabgestimmte Version von Qwen3.5-9B, die speziell für KI-Agenten-Anwendungen entwickelt wurde. Der Entwickler verwendet einen zweistufigen Trainingsansatz: Stufe 1 konzentriert sich auf intensives Schlussfolgerungstraining (bereits abgeschlossen), während Stufe 2 sich auf leichtes Tool-Aufrufen und Agenten-Feinabstimmung konzentriert (zum Zeitpunkt der Ankündigung noch im Gange).

Technische Details

Das Ziel ist es, starke strukturierte Schlussfolgerungen mit sauberer, zuverlässiger Tool-Nutzung zu kombinieren und dabei natürliche Chat-Fähigkeiten beizubehalten. Für Stufe 2 hat der Entwickler einen Datensatz von Hermes-Agenten-Traces gefiltert, den er auf Hugging Face als Open Source veröffentlicht hat.

Wichtige Verbesserungen im gefilterten Datensatz:

Selbstkorrektur: 6% → 63%
Verifizierungsschritte: 26% → 96%
Denktiefe: +40%
Gültige JSON/Tool-Aufrufe: 100%

GGUF-quantisierte Versionen sind bereits zum Download verfügbar, obwohl der Entwickler anmerkt, dass er noch keine ordentlichen Benchmarks durchgeführt hat, da Stufe 2 noch im Training ist. Frühe Überprüfungen des Stufe-1-Checkpoints zeigten gute Ergebnisse für die Schlussfolgerungsstruktur.

Aktueller Status und nächste Schritte

Der Entwickler sucht Feedback dazu, wie sich Harmonic-9B in Agenten-Umgebungen wie OpenClaw, LangGraph und ReAct verhält. Er plant, Benchmark-Zahlen zu teilen, sobald Stufe 2 abgeschlossen ist und ordentliche Agenten-Evaluierungen durchgeführt werden können. Diese Arbeit ist Teil der laufenden Forschung zu hochwertiger Datenkuratierung und gestaffelten Feinabstimmungsansätzen.

📖 Read the full source: r/LocalLLaMA

Harmonic-9B: Zweistufiges Qwen3.5-9B-Finetuning für KI-Agenten

Was ist Harmonic-9B?

Technische Details

Aktueller Status und nächste Schritte

👀 Siehe auch

Benutzer berichten, dass sie für akademische Projektunterstützung von Gemini Pro zu Claude Max gewechselt sind.

Claude Code CC 2.1.124 und 2.1.126: Erinnerung an überschrittenes Dateiänderungsbudget, Aktualisierung der Harness-Anweisungen, REPL wartet auf Klärung, und Erinnerung an Malware-Analyse entfernt

Mühelose Bereitstellung: Neuer Ein-Klick-AWS-Setup für Open Claw veröffentlicht

Claude AI stellt 11 Jahre alte Bitcoin-Wallet im Wert von 400.000 $ wieder her, indem es ein Backup findet und einen Brute-Force-Fehler behebt