MOOSE-Star : Un modèle 7B et un jeu de données de 108 000 articles pour la découverte d'hypothèses scientifiques – ICML 2026

MOOSE-Star est disponible : un modèle de 7B de paramètres post-entraîné pour la découverte d'hypothèses scientifiques, ainsi que le jeu de données TOMATO-Star de 108 717 articles NCBI. Accepté à ICML 2026. Les modèles sont fine-tunés à partir de DeepSeek-R1-Distill-Qwen-7B et se déclinent en trois variantes : MS-IR-7B (récupération d'inspiration), MS-HC-7B (composition d'hypothèses) et MS-7B (usage conjoint).
Détails clés
- Jeu de données : TOMATO-Star – 108 717 articles de NCBI (biologie, chimie, médecine, imagerie médicale, psychologie, sciences cognitives), chacun décomposé en (contexte, hypothèse, inspirations) avec citations réelles. Construit avec environ 38 400 heures GPU A800 de prétraitement.
- Division temporelle : entraînement ≤ sept. 2025, test = oct. 2025 (après la date limite de connaissance du modèle de base).
- Benchmarks de précision de récupération d'inspiration :
- Sélection aléatoire : 6,70 %
- R1-Distilled-Qwen-7B (base) : 28,42 %
- Claude Sonnet 4.6 : 45,02 %
- DeepSeek-R1 : 45,11 %
- Gemini-3 Flash : 51,44 %
- GPT-5.4 : 51,50 %
- MS-7B (7B, IR + HC conjoint) : 54,34 %
- MS-IR-7B (7B, IR uniquement) : 54,37 %
- Gemini-3 Pro : 54,89 %
- Taille du modèle et déploiement : Fine-tune standard de DeepSeek-R1-Distill-Qwen-7B, environ 14 Go en fp16, fonctionne sur un seul GPU de 24 Go. Compatible avec llama.cpp, vLLM, SGLang.
- Licences : Apache-2.0 pour le code, CC-BY-4.0 pour les données.
Article : arxiv.org/abs/2603.03756 | GitHub : github.com/ZonglinY/MOOSE-Star | Collection Hugging Face : huggingface.co/collections/ZonglinY/moose-star-models-and-data
Testez-le. Divulgation : publié par l'équipe communautaire MiroMind.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

yburn : Outil pour auditer et remplacer les tâches cron inutiles des agents IA
yburn est un outil Python qui audite les tâches cron des agents d'IA et remplace celles qui n'ont pas besoin de LLM par des scripts Python autonomes. Le créateur a constaté que 58 % des 98 tâches cron étaient des tâches purement mécaniques comme des vérifications de santé système et des sauvegardes git.

llm-use – Un Cadre Open-Source pour le Routage et l'Orchestration de Flux de Travail Multi-Agents LLM
llm-use révolutionne l'automatisation avec son framework open-source conçu pour acheminer et orchestrer efficacement les workflows multi-agents LLM. Découvrez son impact sur les opérations d'IA.

bad-ass-mcp : MCP gratuit et open source pour le contrôle natif de l'interface graphique de bureau via l'API d'accessibilité
bad-ass-mcp est un serveur MCP open source qui permet à Claude et autres agents IA de contrôler les bureaux macOS, Windows et Linux via la couche d'accessibilité native — sans captures d'écran, sans boucles regarder-déplacer-regarder. Alternative gratuite à Computer Use, Operator ou UiPath.

Mon OpenClaw a obtenu un corps physique : un chien robot avec des yeux, des pattes et une voix
Aucun