MOOSE-Star: 과학적 가설 발견을 위한 7B 모델 및 108K 논문 데이터셋 – ICML 2026

✍️ OpenClawRadar📅 게시일: May 14, 2026🔗 Source
MOOSE-Star: 과학적 가설 발견을 위한 7B 모델 및 108K 논문 데이터셋 – ICML 2026
Ad

MOOSE-Star가 공개되었습니다. 과학적 가설 발견을 위해 사후 훈련된 7B 파라미터 모델과 108,717개의 NCBI 논문으로 구성된 TOMATO-Star 데이터셋입니다. ICML 2026에 채택되었습니다. 모델은 DeepSeek-R1-Distill-Qwen-7B에서 파인튜닝되었으며, MS-IR-7B(영감 검색), MS-HC-7B(가설 구성), MS-7B(통합 사용)의 세 가지 변형이 있습니다.

Ad

주요 세부 사항

  • 데이터셋: TOMATO-Star – NCBI의 108,717개 논문(생물학, 화학, 의학, 의료 영상, 심리학, 인지 과학)으로, 각 논문은 (배경, 가설, 영감)으로 분해되고 실제 인용이 포함됩니다. 약 38,400 A800 GPU 시간의 전처리로 구축되었습니다.
  • 시간적 분할: 훈련 ≤ 2025년 9월, 테스트 = 2025년 10월(기본 모델의 지식 마감일 이후).
  • 영감 검색 정확도 벤치마크:
    • 무작위 선택: 6.70%
    • R1-Distilled-Qwen-7B (기본): 28.42%
    • Claude Sonnet 4.6: 45.02%
    • DeepSeek-R1: 45.11%
    • Gemini-3 Flash: 51.44%
    • GPT-5.4: 51.50%
    • MS-7B (7B, 통합 IR + HC): 54.34%
    • MS-IR-7B (7B, IR 전용): 54.37%
    • Gemini-3 Pro: 54.89%
  • 모델 크기 및 배포: 표준 DeepSeek-R1-Distill-Qwen-7B 파인튠, fp16에서 약 14GB, 단일 24GB GPU에서 실행 가능. llama.cpp, vLLM, SGLang과 호환.
  • 라이선스: 코드는 Apache-2.0, 데이터는 CC-BY-4.0.

논문: arxiv.org/abs/2603.03756 | GitHub: github.com/ZonglinY/MOOSE-Star | Hugging Face 컬렉션: huggingface.co/collections/ZonglinY/moose-star-models-and-data

직접 테스트해보세요. 공개: MiroMind 커뮤니티 팀 게시.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

RelayPlane 오픈소스 프록시, Claude 모델 라우팅으로 73% 비용 절감 효과 확인
Tools

RelayPlane 오픈소스 프록시, Claude 모델 라우팅으로 73% 비용 절감 효과 확인

RelayPlane은 Anthropic API용 오픈 소스 npm 네이티브 프록시로, 복잡도에 따라 적절한 Claude 모델로 요청을 라우팅하여 벤치마크에서 73.4%의 비용 절감 효과를 입증했습니다. 이 도구는 10회 요청당 비용을 $0.0323에서 $0.0086으로 줄이는 동시에 p50 지연 시간을 1.55초에서 0.78초로 개선했습니다.

OpenClawRadar
클로드 커맨드 센터: 클로드 코드 분석을 위한 오픈소스 대시보드
Tools

클로드 커맨드 센터: 클로드 코드 분석을 위한 오픈소스 대시보드

Claude Command Center는 ~/.claude/ 디렉토리를 읽어 Claude Code 세션 데이터, 비용, MCP 서버 구성을 표시하는 로컬 대시보드입니다. Claude Code를 사용하여 Express 백엔드와 React 프론트엔드로 완전히 구축되었으며, 설정이 필요 없고 클라우드나 원격 측정 없이 로컬에서 실행됩니다.

OpenClawRadar
Be My Butler: AI 코드 검증을 위한 멀티 에이전트 파이프라인
Tools

Be My Butler: AI 코드 검증을 위한 멀티 에이전트 파이프라인

Be My Butler는 다양한 AI 모델이 블라인드 검증을 통해 서로의 코드를 검토하는 오픈소스 멀티 에이전트 파이프라인입니다. 이 시스템은 AI 에이전트가 자신의 코드를 잘못된 상태로 보고하는 문제를 해결합니다.

OpenClawRadar
Crow: 오픈소스 MCP 플랫폼, LLM 프론트엔드에 영구 메모리와 P2P 공유 기능 추가
Tools

Crow: 오픈소스 MCP 플랫폼, LLM 프론트엔드에 영구 메모리와 P2P 공유 기능 추가

Crow는 LLM 프론트엔드에 SQLite 기반 영구 메모리, 구조화된 연구 도구, 암호화된 피어 투 피어 공유 기능을 제공하는 오픈소스, 셀프 호스팅 MCP 서버 플랫폼입니다. Claude Desktop, Cursor, Windsurf와 같은 모든 MCP 호환 클라이언트와 작동하며 기본적으로 클라우드 의존성이 필요하지 않습니다.

OpenClawRadar