antrez의 DS4: Mac Metal 및 DGX에서 1M 컨텍스트로 DeepSeek V4 Flash 실행하기

✍️ OpenClawRadar📅 게시일: May 10, 2026🔗 Source
antrez의 DS4: Mac Metal 및 DGX에서 1M 컨텍스트로 DeepSeek V4 Flash 실행하기
Ad

Redis 창시자 Salvatore Sanfilippo (antirez)가 GitHub에 DS4라는 새 프로젝트를 공개했습니다. 목표는 Apple Silicon (Metal) 하드웨어에서 DeepSeek V4 Flash를 1M 토큰 컨텍스트 윈도우로 실행하는 것입니다. 또한 NVIDIA DGX 시스템에서 구동되는 동영상도 게시했습니다.

DS4의 기능

DS4는 새로운 기술을 활용하여 Mac Metal 하드웨어(예: M 시리즈 칩)에서 DeepSeek V4 Flash의 1M 컨텍스트 윈도우를 구현합니다. DGX에서도 시연되어, Pro 6000 같은 고성능 GPU에서 더 빠른 속도로 약간 작은 컨텍스트 윈도우에서도 작동할 가능성을 보여줍니다. 향후 AMD 지원에 대한 기대도 있습니다.

포함 사항

  • 서버 엔드포인트: DS4 서버는 이미 OpenAI 및 Anthropic 호환 API 엔드포인트를 제공하므로, Cursor, Continue.dev 또는 사용자 정의 에이전트와 같은 에이전트 코딩 도구에 쉽게 연결할 수 있습니다.
  • GitHub 저장소: https://github.com/antirez/ds4/ — README에서 설정 지침을 확인하세요. Metal 지원으로 컴파일하고 DeepSeek V4 Flash 가중치를 다운로드하는 과정이 포함될 것입니다.
  • 동영상 데모: 몇 시간 전, antirez가 X에 DGX에서 실행되는 동영상을 게시했습니다: https://x.com/antirez/status/2053381973226184749
Ad

대상 사용자

고성능 Mac 하드웨어(예: Mac Studio, M1 Max/Ultra 또는 M2/M3 탑재 MacBook Pro) 또는 NVIDIA GPU를 보유한 개발자로, 코딩 에이전트나 연구를 위해 매우 큰 컨텍스트 윈도우를 가진 강력한 로컬 LLM을 실행하려는 분들

커뮤니티 참여 요청

Reddit 게시자는 강력한 하드웨어를 가진 모든 분들이 프로젝트를 확인하고 기여해 주시기를 권장합니다. 테스트, 버그 신고, AMD GPU 최적화 등이 가능합니다. 프로젝트는 초기 단계이므로 커뮤니티 참여가 호환성 가속화에 도움이 될 수 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Conduid: Claude로 구축된 MCP 서버를 위한 신뢰 인프라 계층
Tools

Conduid: Claude로 구축된 MCP 서버를 위한 신뢰 인프라 계층

Conduid는 GitHub, npm, PyPI 및 주요 디렉토리에서 25,000개 이상의 MCP 서버를 색인화하며, GitHub 활동, 보안 상태, 문서 품질 및 유지 관리 신호를 기준으로 각 서버에 0-100점을 부여합니다. 전체 코드베이스는 단독 창업자가 Claude를 사용하여 작성했습니다.

OpenClawRadar
SourceBridge: 로컬 LLM을 사용한 코드베이스 분석을 위한 오픈소스 도구
Tools

SourceBridge: 로컬 LLM을 사용한 코드베이스 분석을 위한 오픈소스 도구

SourceBridge는 Git 저장소를 심볼 그래프로 색인화하고 로컬 LLM을 사용하여 코드베이스 요약, 아키텍처 둘러보기 및 학습 자료를 생성하는 오픈소스 도구입니다. OpenAI 호환 API를 통해 Ollama, llama.cpp, vLLM, LM Studio, SGLang 등 여러 로컬 백엔드를 지원합니다.

OpenClawRadar
운명: 동양 전통 점성술을 활용한 결정적 운세 예측을 위한 클로드 코드 플러그인
Tools

운명: 동양 전통 점성술을 활용한 결정적 운세 예측을 위한 클로드 코드 플러그인

Destiny는 사용자의 여덟 자(八子) 생년월일시, 오늘의 일주(日柱), 그리고 주역 괘를 결정론적으로 계산(Python)한 후, Claude를 활용하여 운세 해설을 생성하는 Claude Code 플러그인입니다 — LLM이 지어낸 점성술이 아닙니다.

OpenClawRadar
포지: 클로드 코드로 구축된 클로드 코드용 메모리 시스템
Tools

포지: 클로드 코드로 구축된 클로드 코드용 메모리 시스템

한 개발자가 Claude Code 대화에서 결정, 제약 조건, 거부 사항을 자동으로 포착하는 TypeScript 모노레포 MCP 서버인 Forge를 구축했습니다. 이는 6단계 파이프라인을 사용하여 구조화된 데이터를 분류, 추출하고 이벤트 소싱 SQLite 모델에 저장합니다.

OpenClawRadar