MOOSE-Star : Un modèle 7B et un jeu de données de 108 000 articles pour la découverte d'hypothèses scientifiques – ICML 2026

✍️ OpenClawRadar📅 Publié: May 14, 2026🔗 Source
MOOSE-Star : Un modèle 7B et un jeu de données de 108 000 articles pour la découverte d'hypothèses scientifiques – ICML 2026
Ad

MOOSE-Star est disponible : un modèle de 7B de paramètres post-entraîné pour la découverte d'hypothèses scientifiques, ainsi que le jeu de données TOMATO-Star de 108 717 articles NCBI. Accepté à ICML 2026. Les modèles sont fine-tunés à partir de DeepSeek-R1-Distill-Qwen-7B et se déclinent en trois variantes : MS-IR-7B (récupération d'inspiration), MS-HC-7B (composition d'hypothèses) et MS-7B (usage conjoint).

Ad

Détails clés

  • Jeu de données : TOMATO-Star – 108 717 articles de NCBI (biologie, chimie, médecine, imagerie médicale, psychologie, sciences cognitives), chacun décomposé en (contexte, hypothèse, inspirations) avec citations réelles. Construit avec environ 38 400 heures GPU A800 de prétraitement.
  • Division temporelle : entraînement ≤ sept. 2025, test = oct. 2025 (après la date limite de connaissance du modèle de base).
  • Benchmarks de précision de récupération d'inspiration :
    • Sélection aléatoire : 6,70 %
    • R1-Distilled-Qwen-7B (base) : 28,42 %
    • Claude Sonnet 4.6 : 45,02 %
    • DeepSeek-R1 : 45,11 %
    • Gemini-3 Flash : 51,44 %
    • GPT-5.4 : 51,50 %
    • MS-7B (7B, IR + HC conjoint) : 54,34 %
    • MS-IR-7B (7B, IR uniquement) : 54,37 %
    • Gemini-3 Pro : 54,89 %
  • Taille du modèle et déploiement : Fine-tune standard de DeepSeek-R1-Distill-Qwen-7B, environ 14 Go en fp16, fonctionne sur un seul GPU de 24 Go. Compatible avec llama.cpp, vLLM, SGLang.
  • Licences : Apache-2.0 pour le code, CC-BY-4.0 pour les données.

Article : arxiv.org/abs/2603.03756 | GitHub : github.com/ZonglinY/MOOSE-Star | Collection Hugging Face : huggingface.co/collections/ZonglinY/moose-star-models-and-data

Testez-le. Divulgation : publié par l'équipe communautaire MiroMind.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also