MOOSE-Star: Un modelo de 7B y un conjunto de datos de 108K artículos para el descubrimiento de hipótesis científicas – ICML 2026

✍️ OpenClawRadar📅 Publicado: 14 de mayo de 2026🔗 Source
MOOSE-Star: Un modelo de 7B y un conjunto de datos de 108K artículos para el descubrimiento de hipótesis científicas – ICML 2026
Ad

MOOSE-Star ya está disponible: un modelo de 7B de parámetros entrenado posteriormente para el descubrimiento de hipótesis científicas, junto con el conjunto de datos TOMATO-Star de 108.717 artículos de NCBI. Aceptado en ICML 2026. Los modelos se ajustan a partir de DeepSeek-R1-Distill-Qwen-7B y vienen en tres variantes: MS-IR-7B (recuperación de inspiración), MS-HC-7B (composición de hipótesis) y MS-7B (uso conjunto).

Ad

Detalles clave

  • Conjunto de datos: TOMATO-Star – 108.717 artículos de NCBI (biología, química, medicina, imágenes médicas, psicología, ciencias cognitivas), cada uno desglosado en (antecedentes, hipótesis, inspiraciones) con citas reales. Construido con ~38.400 horas-GPU A800 de preprocesamiento.
  • División temporal: train ≤ Sep 2025, test = Oct 2025 (después del corte de conocimiento del modelo base).
  • Puntos de referencia de precisión de recuperación de inspiración:
    • Selección aleatoria: 6.70%
    • R1-Distilled-Qwen-7B (base): 28.42%
    • Claude Sonnet 4.6: 45.02%
    • DeepSeek-R1: 45.11%
    • Gemini-3 Flash: 51.44%
    • GPT-5.4: 51.50%
    • MS-7B (7B, IR + HC conjunto): 54.34%
    • MS-IR-7B (7B, solo IR): 54.37%
    • Gemini-3 Pro: 54.89%
  • Tamaño del modelo e implementación: Fine-tune estándar de DeepSeek-R1-Distill-Qwen-7B, ~14GB en fp16, se ejecuta en una sola GPU de 24GB. Compatible con llama.cpp, vLLM, SGLang.
  • Licencias: Apache-2.0 para código, CC-BY-4.0 para datos.

Artículo: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Colección Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Pruébalo a fondo. Divulgación: publicado por el equipo comunitario de MiroMind.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también