MOOSE-Star 7B: 54% Genauigkeit bei Hypothesenentdeckung

MOOSE-Star ist da: ein 7B-Parametermodell, nachtrainiert für die Entdeckung wissenschaftlicher Hypothesen, plus der TOMATO-Star-Datensatz mit 108.717 NCBI-Papieren. Angenommen auf der ICML 2026. Die Modelle basieren auf DeepSeek-R1-Distill-Qwen-7B und sind in drei Varianten erhältlich: MS-IR-7B (Inspirationsabruf), MS-HC-7B (Hypothesenaufstellung) und MS-7B (kombiniert).

Wichtige Details

Datensatz: TOMATO-Star – 108.717 Papers von NCBI (Biologie, Chemie, Medizin, medizinische Bildgebung, Psychologie, Kognitionswissenschaft), jeder aufgeteilt in (Hintergrund, Hypothese, Inspirationen) mit echten Zitaten. Erstellt mit ca. 38.400 A800-GPU-Stunden Vorverarbeitung.
Zeitliche Aufteilung: Trainingsdaten ≤ Sep. 2025, Testdaten = Okt. 2025 (nach dem Wissensende des Basismodells).
Benchmarks zur Inspirationstrefferquote:
- Zufallsauswahl: 6,70 %
- R1-Distilled-Qwen-7B (Basis): 28,42 %
- Claude Sonnet 4.6: 45,02 %
- DeepSeek-R1: 45,11 %
- Gemini-3 Flash: 51,44 %
- GPT-5.4: 51,50 %
- MS-7B (7B, kombiniert IR + HC): 54,34 %
- MS-IR-7B (7B, nur IR): 54,37 %
- Gemini-3 Pro: 54,89 %
Modellgröße & Bereitstellung: Standard-DeepSeek-R1-Distill-Qwen-7B-Feintuning, ~14 GB bei fp16, läuft auf einer einzelnen 24-GB-GPU. Kompatibel mit llama.cpp, vLLM, SGLang.
Lizenzen: Apache-2.0 für Code, CC-BY-4.0 für Daten.

Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Hugging Face-Sammlung: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Testen Sie es. Offenlegung: Gepostet vom MiroMind-Community-Team.

📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA

MOOSE-Star: Ein 7B-Modell und 108K-Papierdatensatz für die wissenschaftliche Hypothesenentdeckung – ICML 2026

Wichtige Details

👀 Siehe auch

PocketBot: Ein lokaler KI-Autopilot für iOS mit App-Intents und On-Device-Inferenz

Destillerie: Ein Claude-Code-Plugin für beständigen Team-Kontext

Kostenloses MCP ermöglicht Claude die automatische Analyse von Google Search Console-Daten

Spine Swarm: Multi-Agenten-KI-System auf visueller Leinwand für Nicht-Programmier-Projekte