MOOSE-Star 7B: 54% de Precisão em Hipóteses Científicas

MOOSE-Star foi lançado: um modelo de 7B parâmetros pós-treinado para descoberta de hipóteses científicas, além do conjunto de dados TOMATO-Star com 108.717 artigos do NCBI. Aceito no ICML 2026. Os modelos são fine-tuned a partir do DeepSeek-R1-Distill-Qwen-7B e vêm em três variantes: MS-IR-7B (recuperação de inspiração), MS-HC-7B (composição de hipóteses) e MS-7B (uso conjunto).

Detalhes Principais

Conjunto de dados: TOMATO-Star – 108.717 artigos do NCBI (biologia, química, medicina, imagem médica, psicologia, ciência cognitiva), cada um decomposto em (contexto, hipótese, inspirações) com citações reais. Construído com ~38.400 horas de GPU A800 em pré-processamento.
Divisão temporal: treino ≤ Setembro de 2025, teste = Outubro de 2025 (após o corte de conhecimento do modelo base).
Benchmarks de precisão na recuperação de inspiração:
- Seleção Aleatória: 6,70%
- R1-Distilled-Qwen-7B (base): 28,42%
- Claude Sonnet 4.6: 45,02%
- DeepSeek-R1: 45,11%
- Gemini-3 Flash: 51,44%
- GPT-5.4: 51,50%
- MS-7B (7B, IR + HC conjunto): 54,34%
- MS-IR-7B (7B, apenas IR): 54,37%
- Gemini-3 Pro: 54,89%
Tamanho do modelo e implantação: Fine-tune padrão do DeepSeek-R1-Distill-Qwen-7B, ~14GB em fp16, roda em uma única GPU de 24GB. Compatível com llama.cpp, vLLM, SGLang.
Licenças: Apache-2.0 para código, CC-BY-4.0 para dados.

Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Coleção Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Teste-o. Divulgação: postado pela equipe da comunidade MiroMind.

📖 Leia a fonte completa: r/LocalLLaMA

MOOSE-Star: Um Modelo de 7B e um Conjunto de Dados de 108K Artigos para Descoberta de Hipóteses Científicas – ICML 2026

Detalhes Principais

👀 See Also

ClawCall Ganha Números de Telefone Dedicados: Agentes Agora Podem Reservar um Número para Chamadas de Saída

Agentes de Codificação Paralela com tmux e Especificações em Markdown

SWE-rebench-V2 Lançado: Maior Conjunto de Dados Multilíngue Aberto para Treinamento de Agentes de Código

audio-analyzer-rs: Um Servidor MCP para Análise de Áudio com Claude