MOOSE-Star: Um Modelo de 7B e um Conjunto de Dados de 108K Artigos para Descoberta de Hipóteses Científicas – ICML 2026

MOOSE-Star foi lançado: um modelo de 7B parâmetros pós-treinado para descoberta de hipóteses científicas, além do conjunto de dados TOMATO-Star com 108.717 artigos do NCBI. Aceito no ICML 2026. Os modelos são fine-tuned a partir do DeepSeek-R1-Distill-Qwen-7B e vêm em três variantes: MS-IR-7B (recuperação de inspiração), MS-HC-7B (composição de hipóteses) e MS-7B (uso conjunto).
Detalhes Principais
- Conjunto de dados: TOMATO-Star – 108.717 artigos do NCBI (biologia, química, medicina, imagem médica, psicologia, ciência cognitiva), cada um decomposto em (contexto, hipótese, inspirações) com citações reais. Construído com ~38.400 horas de GPU A800 em pré-processamento.
- Divisão temporal: treino ≤ Setembro de 2025, teste = Outubro de 2025 (após o corte de conhecimento do modelo base).
- Benchmarks de precisão na recuperação de inspiração:
- Seleção Aleatória: 6,70%
- R1-Distilled-Qwen-7B (base): 28,42%
- Claude Sonnet 4.6: 45,02%
- DeepSeek-R1: 45,11%
- Gemini-3 Flash: 51,44%
- GPT-5.4: 51,50%
- MS-7B (7B, IR + HC conjunto): 54,34%
- MS-IR-7B (7B, apenas IR): 54,37%
- Gemini-3 Pro: 54,89%
- Tamanho do modelo e implantação: Fine-tune padrão do DeepSeek-R1-Distill-Qwen-7B, ~14GB em fp16, roda em uma única GPU de 24GB. Compatível com llama.cpp, vLLM, SGLang.
- Licenças: Apache-2.0 para código, CC-BY-4.0 para dados.
Paper: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Coleção Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data
Teste-o. Divulgação: postado pela equipe da comunidade MiroMind.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Claude Skills: 12 Pacotes de Regras de Codificação Rigorosas para TypeScript, Rust, Swift, Go, JS, Postgres e Auditorias
12 arquivos markdown com regras opinativas e conscientes de versão para TS, Rust, Swift, Go, JS, Postgres, segurança, performance, testes, revisão de código, padrões GitHub e commits git. MIT, gratuito, sem cadastro.

O conjunto MCP de código aberto melhora a qualidade da geração de código do Claude em 15-20%.
Um conjunto MCP de código aberto composto por três servidores locais e uma habilidade de prompt aborda o problema do 'token ruim' na geração de código por IA, com um cliente relatando uma melhoria de 15-20% na qualidade para o Claude Code.

Solução Alternativa para a Lacuna de Migração de Projetos do ChatGPT: Exportar Scripts e Prompts
Um desenvolvedor criou scripts em Python e prompts do Claude para migrar conversas do ChatGPT para o Claude quando a exportação de dados do ChatGPT não inclui informações de associação a projetos. A solução extrai conversas usando títulos capturados da interface.

Claude-Code v2.1.111 adiciona o Opus 4.7 xhigh effort, /ultrareview e a ferramenta PowerShell
Claude-Code v2.1.111 apresenta o nível de esforço Opus 4.7 xhigh entre high e max, adiciona o comando /ultrareview para revisões de código baseadas em nuvem com múltiplos agentes, e inicia a implementação do suporte a ferramentas PowerShell no Windows. A atualização também inclui controles interativos /effort, correspondência automática de tema e diversas correções de bugs.