허깅페이스의 물리학 인턴: 멀티 에이전트 프레임워크, CritPt 벤치마크에서 제미니 대비 2배 성능
Hugging Face가 physics-intern을 출시했습니다. 이는 이론 물리학 연구를 위해 설계된 오픈소스 다중 에이전트 프레임워크입니다. 복잡한 문제를 전문화된 하위 에이전트(컴퓨팅, 주장 검토, 연구 전략 도전 에이전트 등)에 할당되는 집중된 작업으로 분해하여 과학적 연구 프로세스를 모방합니다.
아키텍처 및 워크플로
이 프레임워크는 연구 수준의 문제를 여러 하위 작업으로 분해하며, 각 작업은 전담 하위 에이전트가 처리합니다:
- 컴퓨팅 에이전트: 수치 계산 및 시뮬레이션을 처리합니다.
- 검토 에이전트: 주장의 정확성과 일관성을 평가합니다.
- 전략 도전 에이전트: 전체 연구 방향을 비판하고 대안을 제안합니다.
이 에이전트 하네스는 도메인에 구애받지 않도록 설계되었지만, 이론 물리학에 특화되어 조정되었습니다.
벤치마크 성능
CritPt 벤치마크(물리학의 임계점 분석)에서 physics-intern은 Gemini 모델의 성능을 두 배로 향상시키고 GPT-5.5 Pro를 능가하는 새로운 최첨단 결과를 달성했으며, 모두 훨씬 더 낮은 비용으로 이루어졌습니다. 구체적인 수치는 소스에 명시되지 않았지만, 성능 향상은 "두 배" 및 "새로운 SOTA"로 설명됩니다.
사용 가능성
이 프레임워크는 Hugging Face Space로 제공됩니다. 아키텍처와 설계 결정을 자세히 설명하는 블로그 게시물은 아래 링크에서 확인할 수 있습니다. 커뮤니티의 기여와 확장을 환영합니다.
대상: 특히 이론 물리학과 같은 과학 분야에서 에이전트 기반 워크플로를 구축하는 연구자 및 개발자.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

AgenticStore MCP: Claude Desktop용 Python 도구 모음, 27개의 로컬 도구 포함
AgenticStore MCP는 오픈소스 Python 툴킷으로, 여러 MCP 서버를 단일 설치로 대체하여 Claude Desktop에 영구 메모리, 웹 검색, 리포지토리 감사 등 27개의 로컬 도구를 제공하며 Docker나 Node.js 설정이 필요하지 않습니다.

토큰 리듀서: 지능적인 컨텍스트 압축을 위한 Claude 코드 플러그인
Token Reducer는 AST 기반 청킹, 하이브리드 검색, TextRank 압축을 사용하여 저장소 컨텍스트를 로컬에서 처리하여 토큰 사용량을 90-98% 줄이는 Claude Code 플러그인입니다. MIT 라이선스로 제공되며 플러그인 마켓플레이스를 통해 이용할 수 있습니다.

VibeSmith: Claude 코드 프로젝트의 스킬 충돌 감지를 위한 로컬 도구
VibeSmith는 Claude Code 프로젝트 전반에 걸쳐 통합된 가시성을 제공하는 로컬 macOS 데스크톱 앱으로, 전역 및 프로젝트 수준 구성 요소가 이름을 공유할 때 충돌을 감지하고, 의존성을 DAG로 시각화하며, 컨텍스트 토큰 사용량을 추적합니다.

Claude Code용 Slack 플러그인: 컨텍스트 및 업데이트를 위해 Slack에 연결
Slack이 Claude Code용 새로운 플러그인을 출시하여 검색, 메시징, 문서 생성을 위한 Slack 연결을 가능하게 했습니다. 이 플러그인은 Claude Code가 기술적 문제를 해결하고 업데이트를 게시하기 위해 Slack 컨텍스트에 액세스할 수 있도록 합니다.