MOOSE-Star 7B: Descubre hipótesis científicas con 54.34% de precisión

MOOSE-Star ya está disponible: un modelo de 7B de parámetros entrenado posteriormente para el descubrimiento de hipótesis científicas, junto con el conjunto de datos TOMATO-Star de 108.717 artículos de NCBI. Aceptado en ICML 2026. Los modelos se ajustan a partir de DeepSeek-R1-Distill-Qwen-7B y vienen en tres variantes: MS-IR-7B (recuperación de inspiración), MS-HC-7B (composición de hipótesis) y MS-7B (uso conjunto).

Detalles clave

Conjunto de datos: TOMATO-Star – 108.717 artículos de NCBI (biología, química, medicina, imágenes médicas, psicología, ciencias cognitivas), cada uno desglosado en (antecedentes, hipótesis, inspiraciones) con citas reales. Construido con ~38.400 horas-GPU A800 de preprocesamiento.
División temporal: train ≤ Sep 2025, test = Oct 2025 (después del corte de conocimiento del modelo base).
Puntos de referencia de precisión de recuperación de inspiración:
- Selección aleatoria: 6.70%
- R1-Distilled-Qwen-7B (base): 28.42%
- Claude Sonnet 4.6: 45.02%
- DeepSeek-R1: 45.11%
- Gemini-3 Flash: 51.44%
- GPT-5.4: 51.50%
- MS-7B (7B, IR + HC conjunto): 54.34%
- MS-IR-7B (7B, solo IR): 54.37%
- Gemini-3 Pro: 54.89%
Tamaño del modelo e implementación: Fine-tune estándar de DeepSeek-R1-Distill-Qwen-7B, ~14GB en fp16, se ejecuta en una sola GPU de 24GB. Compatible con llama.cpp, vLLM, SGLang.
Licencias: Apache-2.0 para código, CC-BY-4.0 para datos.

Artículo: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Colección Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Pruébalo a fondo. Divulgación: publicado por el equipo comunitario de MiroMind.

📖 Leer la fuente completa: r/LocalLLaMA

MOOSE-Star: Un modelo de 7B y un conjunto de datos de 108K artículos para el descubrimiento de hipótesis científicas – ICML 2026

Detalles clave

👀 Ver también

Solución para la pérdida de memoria de OpenClaw usando el complemento Mem0.

Clawforce: Plano de Control de Código Abierto para Gestionar Equipos de Agentes Clawbot

Sistema de 2 Prompts para Mantener el Contexto entre Conversaciones de Claude sin Desperdicio de Tokens

Sistema de Código Abierto Captura Patrones de Código Claude en Documentación en Evolución