MOOSE-Star: Ein 7B-Modell und 108K-Papierdatensatz für die wissenschaftliche Hypothesenentdeckung – ICML 2026

✍️ OpenClawRadar📅 Veröffentlicht: 14. Mai 2026🔗 Source
MOOSE-Star: Ein 7B-Modell und 108K-Papierdatensatz für die wissenschaftliche Hypothesenentdeckung – ICML 2026
Ad

MOOSE-Star ist da: ein 7B-Parametermodell, nachtrainiert für die Entdeckung wissenschaftlicher Hypothesen, plus der TOMATO-Star-Datensatz mit 108.717 NCBI-Papieren. Angenommen auf der ICML 2026. Die Modelle basieren auf DeepSeek-R1-Distill-Qwen-7B und sind in drei Varianten erhältlich: MS-IR-7B (Inspirationsabruf), MS-HC-7B (Hypothesenaufstellung) und MS-7B (kombiniert).

Ad

Wichtige Details

  • Datensatz: TOMATO-Star – 108.717 Papers von NCBI (Biologie, Chemie, Medizin, medizinische Bildgebung, Psychologie, Kognitionswissenschaft), jeder aufgeteilt in (Hintergrund, Hypothese, Inspirationen) mit echten Zitaten. Erstellt mit ca. 38.400 A800-GPU-Stunden Vorverarbeitung.
  • Zeitliche Aufteilung: Trainingsdaten ≤ Sep. 2025, Testdaten = Okt. 2025 (nach dem Wissensende des Basismodells).
  • Benchmarks zur Inspirationstrefferquote:
    • Zufallsauswahl: 6,70 %
    • R1-Distilled-Qwen-7B (Basis): 28,42 %
    • Claude Sonnet 4.6: 45,02 %
    • DeepSeek-R1: 45,11 %
    • Gemini-3 Flash: 51,44 %
    • GPT-5.4: 51,50 %
    • MS-7B (7B, kombiniert IR + HC): 54,34 %
    • MS-IR-7B (7B, nur IR): 54,37 %
    • Gemini-3 Pro: 54,89 %
  • Modellgröße & Bereitstellung: Standard-DeepSeek-R1-Distill-Qwen-7B-Feintuning, ~14 GB bei fp16, läuft auf einer einzelnen 24-GB-GPU. Kompatibel mit llama.cpp, vLLM, SGLang.
  • Lizenzen: Apache-2.0 für Code, CC-BY-4.0 für Daten.

Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Hugging Face-Sammlung: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Testen Sie es. Offenlegung: Gepostet vom MiroMind-Community-Team.

📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA

Ad

👀 Siehe auch

Zwei Muster zur Verhinderung von KI-Agenten-Gedächtnisverfall: AutoDream und Skeptisches Retrieval
Werkzeuge

Zwei Muster zur Verhinderung von KI-Agenten-Gedächtnisverfall: AutoDream und Skeptisches Retrieval

OpenClaw stellt zwei MIT-lizenzierte Muster vor, um den langsamen Verfall in dateibasierten KI-Gedächtnissystemen anzugehen: AutoDream für nächtliche Gedächtniskonsolidierung und Skeptical Retrieval für abklinggewichtete Gedächtnisbewertung. Beide arbeiten zusammen in einer sich selbst verbessernden Schleife, um den Kontext von Agenten aktuell zu halten.

OpenClawRadar
Selbstgehosteter GitHub-Bot betreibt Claude Code mit über 40 Webhook-Triggern und MCP-Tools
Werkzeuge

Selbstgehosteter GitHub-Bot betreibt Claude Code mit über 40 Webhook-Triggern und MCP-Tools

Ein selbst gehosteter GitHub-Bot nutzt das Claude Agent SDK mit vollständigen Claude Code-Funktionen, unterstützt über 40 Webhook-Trigger, 4 integrierte MCP-Server und benutzerdefinierte YAML-basierte Workflows für PR-Review, CI-Autofix und Issue-Triage.

OpenClawRadar
OpenClaw-Fähigkeit fügt KI-Bildgenerierung mit lokaler ComfyUI-Unterstützung und kuratierten Prompts hinzu
Werkzeuge

OpenClaw-Fähigkeit fügt KI-Bildgenerierung mit lokaler ComfyUI-Unterstützung und kuratierten Prompts hinzu

Eine neue OpenClaw-Fähigkeit bietet KI-Bildgenerierung direkt im Terminal mit über 1.300 kuratierten Prompts, lokaler ComfyUI-Integration und Prompt-Verbesserungs-Workflows.

OpenClawRadar
🦀
Werkzeuge

Tendril: Ein sich selbst erweiternder Agent, der Werkzeuge im Handumdrehen erstellt und registriert

Tendril ist eine agentische Sandbox, die autonom Werkzeuge entdeckt, erstellt und registriert. Sie startet mit nur drei Bootstrap-Werkzeugen und erweitert dynamisch ihre Fähigkeitsregistrierung, ohne den Nutzer zu fragen.

OpenClawRadar