MOOSE-Star: Un modelo de 7B y un conjunto de datos de 108K artículos para el descubrimiento de hipótesis científicas – ICML 2026

MOOSE-Star ya está disponible: un modelo de 7B de parámetros entrenado posteriormente para el descubrimiento de hipótesis científicas, junto con el conjunto de datos TOMATO-Star de 108.717 artículos de NCBI. Aceptado en ICML 2026. Los modelos se ajustan a partir de DeepSeek-R1-Distill-Qwen-7B y vienen en tres variantes: MS-IR-7B (recuperación de inspiración), MS-HC-7B (composición de hipótesis) y MS-7B (uso conjunto).
Detalles clave
- Conjunto de datos: TOMATO-Star – 108.717 artículos de NCBI (biología, química, medicina, imágenes médicas, psicología, ciencias cognitivas), cada uno desglosado en (antecedentes, hipótesis, inspiraciones) con citas reales. Construido con ~38.400 horas-GPU A800 de preprocesamiento.
- División temporal: train ≤ Sep 2025, test = Oct 2025 (después del corte de conocimiento del modelo base).
- Puntos de referencia de precisión de recuperación de inspiración:
- Selección aleatoria: 6.70%
- R1-Distilled-Qwen-7B (base): 28.42%
- Claude Sonnet 4.6: 45.02%
- DeepSeek-R1: 45.11%
- Gemini-3 Flash: 51.44%
- GPT-5.4: 51.50%
- MS-7B (7B, IR + HC conjunto): 54.34%
- MS-IR-7B (7B, solo IR): 54.37%
- Gemini-3 Pro: 54.89%
- Tamaño del modelo e implementación: Fine-tune estándar de DeepSeek-R1-Distill-Qwen-7B, ~14GB en fp16, se ejecuta en una sola GPU de 24GB. Compatible con llama.cpp, vLLM, SGLang.
- Licencias: Apache-2.0 para código, CC-BY-4.0 para datos.
Artículo: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Colección Hugging Face: huggingface.co/collections/ZonglinY/moose-star-models-and-data
Pruébalo a fondo. Divulgación: publicado por el equipo comunitario de MiroMind.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Toroidal Logit Bias: Truco simple en inferencia reduce alucinaciones en 40%
Un nuevo metodo mapea tokens a un toro y refuerza logits cercanos, reduciendo errores sin fine-tuning o RAG.

Ejecuta LLMs locales en tu teléfono con Observer: agentes sin conexión para monitoreo y registro
Observer es una aplicación iOS de código abierto que ejecuta LLM multimodales localmente en tu teléfono para monitorear eventos, registrar datos y activar notificaciones de Discord, todo sin conexión y gratis.

PageAgent: Agente de IA para Navegador que Se Ejecuta Dentro de Páginas Web con Soporte para Ollama
PageAgent es una biblioteca de JavaScript que ejecuta agentes de IA directamente dentro de páginas web, leyendo el DOM en vivo como texto en lugar de usar capturas de pantalla. Funciona con cualquier endpoint compatible con OpenAI, incluido Ollama, permitiendo llamadas a LLM locales directamente desde el navegador.

TideSurf: herramienta de compresión DOM reduce el uso de tokens de agentes web 30 veces, acelera TTFT 12 veces
TideSurf v0.3 convierte el DOM renderizado a un formato comprimido similar a markdown, reduciendo el consumo de tokens en 32 veces en páginas de GitHub en comparación con el DOM crudo, mientras añade 18 herramientas interactivas para agentes LLM.