Harmonic-9B : Affinage en deux étapes de Qwen3.5-9B pour agents IA

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
Harmonic-9B : Affinage en deux étapes de Qwen3.5-9B pour agents IA
Ad

Qu'est-ce que Harmonic-9B ?

Harmonic-9B est une version affinée de Qwen3.5-9B spécifiquement conçue pour les applications d'agents IA. Le développeur utilise une approche d'entraînement en deux étapes : l'étape 1 se concentre sur l'entraînement au raisonnement approfondi (déjà terminée), tandis que l'étape 2 se concentre sur l'utilisation légère d'outils et l'affinement pour agents (encore en cours au moment de l'annonce).

Détails techniques

L'objectif est de combiner un raisonnement structuré solide avec une utilisation d'outils propre et fiable, tout en conservant des capacités de conversation naturelles. Pour l'étape 2, le développeur a filtré un jeu de données de traces d'agents Hermes, qu'il a rendu open source sur Hugging Face.

Améliorations clés dans le jeu de données filtré :

  • Auto-correction : 6 % → 63 %
  • Étapes de vérification : 26 % → 96 %
  • Profondeur de réflexion : +40 %
  • Appels d'outils/JSON valides : 100 %

Les versions quantifiées GGUF sont déjà disponibles au téléchargement, bien que le développeur note qu'il n'a pas encore effectué de benchmarks appropriés car l'étape 2 est toujours en cours d'entraînement. Les premiers tests sur le checkpoint de l'étape 1 ont montré de bons résultats pour la structure de raisonnement.

Ad

Statut actuel et prochaines étapes

Le développeur sollicite des retours sur le comportement de Harmonic-9B dans des environnements d'agents comme OpenClaw, LangGraph et ReAct. Il prévoit de partager les chiffres des benchmarks une fois l'étape 2 terminée et qu'il pourra effectuer des évaluations d'agents appropriées. Ce travail fait partie de recherches continues sur la curation de données à fort signal et les approches d'affinement par étapes.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Lovable offre 100 $ de crédits gratuits pour l'API Claude à l'occasion de la Journée internationale des femmes.
News

Lovable offre 100 $ de crédits gratuits pour l'API Claude à l'occasion de la Journée internationale des femmes.

Lovable offre 100 $ de crédits API Anthropic Claude, 250 $ de crédits de frais Stripe et un accès gratuit de 24 heures à sa plateforme jusqu'au 8 mars. Les utilisateurs doivent réclamer l'offre avant 12 h 59 HE le 9 mars.

OpenClawRadar
Claude Code ajoute la saisie vocale avec fonctionnalité de pousser-pour-parler.
News

Claude Code ajoute la saisie vocale avec fonctionnalité de pousser-pour-parler.

Claude Code déploie le mode vocal à environ 5 % des utilisateurs initialement, avec une activation push-to-talk en maintenant la barre d'espace. Les jetons de transcription vocale ne comptent pas dans les limites de taux et la fonctionnalité est incluse sans frais supplémentaires.

OpenClawRadar
GM licencie 600 travailleurs informatiques et embauche des ingénieurs spécialisés en IA pour le développement d'agents et de modèles.
News

GM licencie 600 travailleurs informatiques et embauche des ingénieurs spécialisés en IA pour le développement d'agents et de modèles.

General Motors a licencié 600 employés informatiques (~10 % du département) pour embaucher des travailleurs ayant des compétences natives en IA : développement d'agents, ingénierie des données, ingénierie cloud, ingénierie des invites.

OpenClawRadar
Les agents gérés Claude ajoutent le rêve, les résultats, l'orchestration multi-agents et les webhooks
News

Les agents gérés Claude ajoutent le rêve, les résultats, l'orchestration multi-agents et les webhooks

Le rêve est un processus programmé de curation des mémoires qui a amélioré les taux d'achèvement des tâches d'environ 6 fois dans les tests Harvey. Les résultats, l'orchestration multi-agent et les webhooks sont désormais en bêta publique sur la Claude Platform.

OpenClawRadar