MOOSE-Star: Ein 7B-Modell und 108K-Papierdatensatz für die wissenschaftliche Hypothesenentdeckung – ICML 2026

MOOSE-Star ist da: ein 7B-Parametermodell, nachtrainiert für die Entdeckung wissenschaftlicher Hypothesen, plus der TOMATO-Star-Datensatz mit 108.717 NCBI-Papieren. Angenommen auf der ICML 2026. Die Modelle basieren auf DeepSeek-R1-Distill-Qwen-7B und sind in drei Varianten erhältlich: MS-IR-7B (Inspirationsabruf), MS-HC-7B (Hypothesenaufstellung) und MS-7B (kombiniert).
Wichtige Details
- Datensatz: TOMATO-Star – 108.717 Papers von NCBI (Biologie, Chemie, Medizin, medizinische Bildgebung, Psychologie, Kognitionswissenschaft), jeder aufgeteilt in (Hintergrund, Hypothese, Inspirationen) mit echten Zitaten. Erstellt mit ca. 38.400 A800-GPU-Stunden Vorverarbeitung.
- Zeitliche Aufteilung: Trainingsdaten ≤ Sep. 2025, Testdaten = Okt. 2025 (nach dem Wissensende des Basismodells).
- Benchmarks zur Inspirationstrefferquote:
- Zufallsauswahl: 6,70 %
- R1-Distilled-Qwen-7B (Basis): 28,42 %
- Claude Sonnet 4.6: 45,02 %
- DeepSeek-R1: 45,11 %
- Gemini-3 Flash: 51,44 %
- GPT-5.4: 51,50 %
- MS-7B (7B, kombiniert IR + HC): 54,34 %
- MS-IR-7B (7B, nur IR): 54,37 %
- Gemini-3 Pro: 54,89 %
- Modellgröße & Bereitstellung: Standard-DeepSeek-R1-Distill-Qwen-7B-Feintuning, ~14 GB bei fp16, läuft auf einer einzelnen 24-GB-GPU. Kompatibel mit llama.cpp, vLLM, SGLang.
- Lizenzen: Apache-2.0 für Code, CC-BY-4.0 für Daten.
Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Hugging Face-Sammlung: huggingface.co/collections/ZonglinY/moose-star-models-and-data
Testen Sie es. Offenlegung: Gepostet vom MiroMind-Community-Team.
📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA
👀 Siehe auch

Zwei Muster zur Verhinderung von KI-Agenten-Gedächtnisverfall: AutoDream und Skeptisches Retrieval
OpenClaw stellt zwei MIT-lizenzierte Muster vor, um den langsamen Verfall in dateibasierten KI-Gedächtnissystemen anzugehen: AutoDream für nächtliche Gedächtniskonsolidierung und Skeptical Retrieval für abklinggewichtete Gedächtnisbewertung. Beide arbeiten zusammen in einer sich selbst verbessernden Schleife, um den Kontext von Agenten aktuell zu halten.

Selbstgehosteter GitHub-Bot betreibt Claude Code mit über 40 Webhook-Triggern und MCP-Tools
Ein selbst gehosteter GitHub-Bot nutzt das Claude Agent SDK mit vollständigen Claude Code-Funktionen, unterstützt über 40 Webhook-Trigger, 4 integrierte MCP-Server und benutzerdefinierte YAML-basierte Workflows für PR-Review, CI-Autofix und Issue-Triage.

OpenClaw-Fähigkeit fügt KI-Bildgenerierung mit lokaler ComfyUI-Unterstützung und kuratierten Prompts hinzu
Eine neue OpenClaw-Fähigkeit bietet KI-Bildgenerierung direkt im Terminal mit über 1.300 kuratierten Prompts, lokaler ComfyUI-Integration und Prompt-Verbesserungs-Workflows.
Tendril: Ein sich selbst erweiternder Agent, der Werkzeuge im Handumdrehen erstellt und registriert
Tendril ist eine agentische Sandbox, die autonom Werkzeuge entdeckt, erstellt und registriert. Sie startet mit nur drei Bootstrap-Werkzeugen und erweitert dynamisch ihre Fähigkeitsregistrierung, ohne den Nutzer zu fragen.