Harmonic-9B: Ajuste fino en dos etapas de Qwen3.5-9B para agentes

¿Qué es Harmonic-9B?

Harmonic-9B es una versión ajustada de Qwen3.5-9B específicamente diseñada para aplicaciones de agentes de IA. El desarrollador está utilizando un enfoque de entrenamiento en dos etapas: la Etapa 1 se centra en el entrenamiento de razonamiento intensivo (ya completado), mientras que la Etapa 2 se enfoca en llamadas a herramientas ligeras y ajuste fino de agentes (aún en progreso al momento del anuncio).

Detalles Técnicos

El objetivo es combinar un razonamiento estructurado sólido con un uso de herramientas limpio y confiable, manteniendo capacidades de chat natural. Para la Etapa 2, el desarrollador ha filtrado un conjunto de datos de trazas de agentes Hermes, que ha publicado como código abierto en Hugging Face.

Mejoras clave en el conjunto de datos filtrado:

Autocorrección: 6% → 63%
Pasos de verificación: 26% → 96%
Profundidad de pensamiento: +40%
Llamadas a herramientas/JSON válidos: 100%

Ya están disponibles versiones cuantizadas GGUF para descargar, aunque el desarrollador señala que aún no ha ejecutado pruebas de referencia adecuadas porque la Etapa 2 sigue en entrenamiento. Las verificaciones iniciales en el punto de control de la Etapa 1 mostraron buenos resultados para la estructura de razonamiento.

Estado Actual y Próximos Pasos

El desarrollador está buscando comentarios sobre cómo se comporta Harmonic-9B en entornos de agentes como OpenClaw, LangGraph y ReAct. Planean compartir números de referencia una vez que finalice la Etapa 2 y puedan ejecutar evaluaciones adecuadas de agentes. Este trabajo es parte de una investigación continua sobre la curación de datos de alta señal y enfoques de ajuste fino por etapas.

📖 Read the full source: r/LocalLLaMA

Harmonic-9B: Ajuste fino en dos etapas de Qwen3.5-9B para agentes de IA

¿Qué es Harmonic-9B?

Detalles Técnicos

Estado Actual y Próximos Pasos

👀 Ver también

Microsoft's BitNet Permite la Inferencia de un LLM de 100B Parámetros en una Sola CPU

Claude Code v2.1.68: Opus 4.6 por defecto usa esfuerzo medio, reintroduce la palabra clave ultrathink

NVIDIA anuncia NemoClaw con funciones de seguridad OpenShell.

Claude.ai actualmente caído, errores de API elevados — 28 de abril de 2026