MOOSE-Star: Um Modelo de 7B e um Conjunto de Dados de 108K Artigos para Descoberta de Hipóteses Científicas – ICML 2026

✍️ OpenClawRadar📅 Publicado: May 14, 2026🔗 Source
MOOSE-Star: Um Modelo de 7B e um Conjunto de Dados de 108K Artigos para Descoberta de Hipóteses Científicas – ICML 2026
Ad

MOOSE-Star foi lançado: um modelo de 7B parâmetros pós-treinado para descoberta de hipóteses científicas, além do conjunto de dados TOMATO-Star com 108.717 artigos do NCBI. Aceito no ICML 2026. Os modelos são fine-tuned a partir do DeepSeek-R1-Distill-Qwen-7B e vêm em três variantes: MS-IR-7B (recuperação de inspiração), MS-HC-7B (composição de hipóteses) e MS-7B (uso conjunto).

Ad

Detalhes Principais

  • Conjunto de dados: TOMATO-Star – 108.717 artigos do NCBI (biologia, química, medicina, imagem médica, psicologia, ciência cognitiva), cada um decomposto em (contexto, hipótese, inspirações) com citações reais. Construído com ~38.400 horas de GPU A800 em pré-processamento.
  • Divisão temporal: treino ≤ Setembro de 2025, teste = Outubro de 2025 (após o corte de conhecimento do modelo base).
  • Benchmarks de precisão na recuperação de inspiração:
    • Seleção Aleatória: 6,70%
    • R1-Distilled-Qwen-7B (base): 28,42%
    • Claude Sonnet 4.6: 45,02%
    • DeepSeek-R1: 45,11%
    • Gemini-3 Flash: 51,44%
    • GPT-5.4: 51,50%
    • MS-7B (7B, IR + HC conjunto): 54,34%
    • MS-IR-7B (7B, apenas IR): 54,37%
    • Gemini-3 Pro: 54,89%
  • Tamanho do modelo e implantação: Fine-tune padrão do DeepSeek-R1-Distill-Qwen-7B, ~14GB em fp16, roda em uma única GPU de 24GB. Compatível com llama.cpp, vLLM, SGLang.
  • Licenças: Apache-2.0 para código, CC-BY-4.0 para dados.

Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Coleção Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data

Teste-o. Divulgação: postado pela equipe da comunidade MiroMind.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Claude Skills: 12 Pacotes de Regras de Codificação Rigorosas para TypeScript, Rust, Swift, Go, JS, Postgres e Auditorias
Tools

Claude Skills: 12 Pacotes de Regras de Codificação Rigorosas para TypeScript, Rust, Swift, Go, JS, Postgres e Auditorias

12 arquivos markdown com regras opinativas e conscientes de versão para TS, Rust, Swift, Go, JS, Postgres, segurança, performance, testes, revisão de código, padrões GitHub e commits git. MIT, gratuito, sem cadastro.

OpenClawRadar
O conjunto MCP de código aberto melhora a qualidade da geração de código do Claude em 15-20%.
Tools

O conjunto MCP de código aberto melhora a qualidade da geração de código do Claude em 15-20%.

Um conjunto MCP de código aberto composto por três servidores locais e uma habilidade de prompt aborda o problema do 'token ruim' na geração de código por IA, com um cliente relatando uma melhoria de 15-20% na qualidade para o Claude Code.

OpenClawRadar
Solução Alternativa para a Lacuna de Migração de Projetos do ChatGPT: Exportar Scripts e Prompts
Tools

Solução Alternativa para a Lacuna de Migração de Projetos do ChatGPT: Exportar Scripts e Prompts

Um desenvolvedor criou scripts em Python e prompts do Claude para migrar conversas do ChatGPT para o Claude quando a exportação de dados do ChatGPT não inclui informações de associação a projetos. A solução extrai conversas usando títulos capturados da interface.

OpenClawRadar
Claude-Code v2.1.111 adiciona o Opus 4.7 xhigh effort, /ultrareview e a ferramenta PowerShell
Tools

Claude-Code v2.1.111 adiciona o Opus 4.7 xhigh effort, /ultrareview e a ferramenta PowerShell

Claude-Code v2.1.111 apresenta o nível de esforço Opus 4.7 xhigh entre high e max, adiciona o comando /ultrareview para revisões de código baseadas em nuvem com múltiplos agentes, e inicia a implementação do suporte a ferramentas PowerShell no Windows. A atualização também inclui controles interativos /effort, correspondência automática de tema e diversas correções de bugs.

OpenClawRadar