MOOSE-Star : 7B model + 108K papers for hypothesis discovery

MOOSE-Star est disponible : un modèle de 7B de paramètres post-entraîné pour la découverte d'hypothèses scientifiques, ainsi que le jeu de données TOMATO-Star de 108 717 articles NCBI. Accepté à ICML 2026. Les modèles sont fine-tunés à partir de DeepSeek-R1-Distill-Qwen-7B et se déclinent en trois variantes : MS-IR-7B (récupération d'inspiration), MS-HC-7B (composition d'hypothèses) et MS-7B (usage conjoint).

Détails clés

Jeu de données : TOMATO-Star – 108 717 articles de NCBI (biologie, chimie, médecine, imagerie médicale, psychologie, sciences cognitives), chacun décomposé en (contexte, hypothèse, inspirations) avec citations réelles. Construit avec environ 38 400 heures GPU A800 de prétraitement.
Division temporelle : entraînement ≤ sept. 2025, test = oct. 2025 (après la date limite de connaissance du modèle de base).
Benchmarks de précision de récupération d'inspiration :
- Sélection aléatoire : 6,70 %
- R1-Distilled-Qwen-7B (base) : 28,42 %
- Claude Sonnet 4.6 : 45,02 %
- DeepSeek-R1 : 45,11 %
- Gemini-3 Flash : 51,44 %
- GPT-5.4 : 51,50 %
- MS-7B (7B, IR + HC conjoint) : 54,34 %
- MS-IR-7B (7B, IR uniquement) : 54,37 %
- Gemini-3 Pro : 54,89 %
Taille du modèle et déploiement : Fine-tune standard de DeepSeek-R1-Distill-Qwen-7B, environ 14 Go en fp16, fonctionne sur un seul GPU de 24 Go. Compatible avec llama.cpp, vLLM, SGLang.
Licences : Apache-2.0 pour le code, CC-BY-4.0 pour les données.

Article : arxiv.org/abs/2603.03756 | GitHub : github.com/ZonglinY/MOOSE-Star | Collection Hugging Face : huggingface.co/collections/ZonglinY/moose-star-models-and-data

Testez-le. Divulgation : publié par l'équipe communautaire MiroMind.

📖 Lire la source complète : r/LocalLLaMA

MOOSE-Star : Un modèle 7B et un jeu de données de 108 000 articles pour la découverte d'hypothèses scientifiques – ICML 2026

Détails clés

👀 See Also

Centre de Compétences Claude : Répertoire consultable de 789+ Compétences de Code Claude et 10 Agents Autonomes

Flux de travail d'agent IA local utilisant OpenCode, FastMCP et DeepSeek-r1

Créer une application de production complète avec Claude : ce qui a fonctionné et ce qui n'a pas fonctionné

Prefex : Un proxy local pour Claude Code qui automatise la mise en cache des invites et la mémoire de session