Harmonic-9B : Affinage Qwen3.5-9B pour agents IA

Qu'est-ce que Harmonic-9B ?

Harmonic-9B est une version affinée de Qwen3.5-9B spécifiquement conçue pour les applications d'agents IA. Le développeur utilise une approche d'entraînement en deux étapes : l'étape 1 se concentre sur l'entraînement au raisonnement approfondi (déjà terminée), tandis que l'étape 2 se concentre sur l'utilisation légère d'outils et l'affinement pour agents (encore en cours au moment de l'annonce).

Détails techniques

L'objectif est de combiner un raisonnement structuré solide avec une utilisation d'outils propre et fiable, tout en conservant des capacités de conversation naturelles. Pour l'étape 2, le développeur a filtré un jeu de données de traces d'agents Hermes, qu'il a rendu open source sur Hugging Face.

Améliorations clés dans le jeu de données filtré :

Auto-correction : 6 % → 63 %
Étapes de vérification : 26 % → 96 %
Profondeur de réflexion : +40 %
Appels d'outils/JSON valides : 100 %

Les versions quantifiées GGUF sont déjà disponibles au téléchargement, bien que le développeur note qu'il n'a pas encore effectué de benchmarks appropriés car l'étape 2 est toujours en cours d'entraînement. Les premiers tests sur le checkpoint de l'étape 1 ont montré de bons résultats pour la structure de raisonnement.

Statut actuel et prochaines étapes

Le développeur sollicite des retours sur le comportement de Harmonic-9B dans des environnements d'agents comme OpenClaw, LangGraph et ReAct. Il prévoit de partager les chiffres des benchmarks une fois l'étape 2 terminée et qu'il pourra effectuer des évaluations d'agents appropriées. Ce travail fait partie de recherches continues sur la curation de données à fort signal et les approches d'affinement par étapes.

📖 Read the full source: r/LocalLLaMA

Harmonic-9B : Affinage en deux étapes de Qwen3.5-9B pour agents IA

Qu'est-ce que Harmonic-9B ?

Détails techniques

Statut actuel et prochaines étapes

👀 See Also

Le codage agentique est un piège : Dette cognitive et atrophie

Mémoire représente maintenant 63% du coût des puces IA : les dépenses HBM atteignent 32 milliards de dollars

Titre : Les Mac pour LLM local et OpenClaw : le goulot d'étranglement du traitement des prompts rend le cloud moins cher

La consommation d'énergie du GPU s'écarte de la théorie du prédicteur de jetons dans les petits LLM