Harmonic-9B: Zweistufiges Qwen3.5-9B-Finetuning für KI-Agenten

Was ist Harmonic-9B?
Harmonic-9B ist eine feinabgestimmte Version von Qwen3.5-9B, die speziell für KI-Agenten-Anwendungen entwickelt wurde. Der Entwickler verwendet einen zweistufigen Trainingsansatz: Stufe 1 konzentriert sich auf intensives Schlussfolgerungstraining (bereits abgeschlossen), während Stufe 2 sich auf leichtes Tool-Aufrufen und Agenten-Feinabstimmung konzentriert (zum Zeitpunkt der Ankündigung noch im Gange).
Technische Details
Das Ziel ist es, starke strukturierte Schlussfolgerungen mit sauberer, zuverlässiger Tool-Nutzung zu kombinieren und dabei natürliche Chat-Fähigkeiten beizubehalten. Für Stufe 2 hat der Entwickler einen Datensatz von Hermes-Agenten-Traces gefiltert, den er auf Hugging Face als Open Source veröffentlicht hat.
Wichtige Verbesserungen im gefilterten Datensatz:
- Selbstkorrektur: 6% → 63%
- Verifizierungsschritte: 26% → 96%
- Denktiefe: +40%
- Gültige JSON/Tool-Aufrufe: 100%
GGUF-quantisierte Versionen sind bereits zum Download verfügbar, obwohl der Entwickler anmerkt, dass er noch keine ordentlichen Benchmarks durchgeführt hat, da Stufe 2 noch im Training ist. Frühe Überprüfungen des Stufe-1-Checkpoints zeigten gute Ergebnisse für die Schlussfolgerungsstruktur.
Aktueller Status und nächste Schritte
Der Entwickler sucht Feedback dazu, wie sich Harmonic-9B in Agenten-Umgebungen wie OpenClaw, LangGraph und ReAct verhält. Er plant, Benchmark-Zahlen zu teilen, sobald Stufe 2 abgeschlossen ist und ordentliche Agenten-Evaluierungen durchgeführt werden können. Diese Arbeit ist Teil der laufenden Forschung zu hochwertiger Datenkuratierung und gestaffelten Feinabstimmungsansätzen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

OpenClaw Gateway Zuverlässigkeitsprobleme: Stille Ausfälle nach 25 Tagen intensiver Nutzung
Ein detaillierter Bericht eines OpenClaw-Benutzers, der 25 Tage lang 18+ Cron-Jobs mit Telegram ausgeführt hat, identifiziert ein kritisches Muster, bei dem das Gateway in einen 'zombifizierten' Zustand gerät – es wird als laufend angezeigt, aber alle Funktionen sind eingefroren. Der Benutzer dokumentiert spezifische Probleme, darunter Sitzungsschreibsperren, die dauerhaft gehalten werden, Cron-Jobs, die in Phantom-Laufzuständen stecken bleiben, und stille Fehler bei ungültigen Konfigurationen.

Meta veröffentlicht BOxCrete KI-Modell für Betonmischungsentwurf
Meta hat Bayesian Optimization for Concrete (BOxCrete) veröffentlicht, ein Open-Source-KI-Modell zur Gestaltung nachhaltiger Betonmischungen unter Verwendung von in den USA produzierten Materialien. Das Modell verbessert frühere Versionen durch bessere Robustheit gegenüber Störungen und verbesserte Vorhersagefähigkeiten für das Setzmaß.

Wöchentlicher r/ClaudeAI-Überlebensleitfaden: Opus 4.7, Abrechnungsfehler und Datenbanklöschvorfall
Wilsons wöchentlicher Survival Guide destilliert die wichtigsten r/ClaudeAI-Threads (50+ Kommentare) in umsetzbare Lektionen: Opus 4.7-Diskurs, ein Abrechnungsfehler durch Git-Dateinamen, ein KI-Agent, der eine gesamte Datenbank in 9 Sekunden löschte, und Copilots 9-fache Preiserhöhung für Claude-Modelle.

Delve wird beschuldigt, Sim.ai's Open-Source-Software SimStudio geforkt und als Pathways verkauft zu haben.
Das Compliance-Startup Delve soll angeblich das Open-Source-Agenten-Entwicklungstool SimStudio von Sim.ai geforkt, es in Pathways umbenannt und ohne ordnungsgemäße Lizenzzuweisung oder finanzielle Vereinbarung mit Sim.ai verkauft haben, was möglicherweise gegen die Apache-Lizenzbedingungen verstößt.