antirezのDS4:Mac MetalとDGXでDeepSeek V4 Flashを100万コンテクストで実行

Redisの作者Salvatore Sanfilippo(antirez)が、新プロジェクトDS4をGitHubで公開しました。目標は、Apple Silicon(Metal)ハードウェア上で1Mトークンのコンテキストウィンドウを持つDeepSeek V4 Flashを動作させることです。また、NVIDIA DGXシステム上で動作する動画も公開しています。
DS4の機能
DS4は新しい技術を活用し、Mac Metalハードウェア(例:Mシリーズチップ)上でDeepSeek V4 Flashに1Mのコンテキストウィンドウを適合させます。また、DGX上でも実証済みで、高性能GPU(Pro 6000など)上でやや小さいコンテキストウィンドウながら高速動作が可能かもしれません。将来的なAMDサポートの可能性も示唆されています。
含まれるもの
- サーバーエンドポイント:DS4サーバーはすでにOpenAIおよびAnthropic互換のAPIエンドポイントを提供しており、Cursor、Continue.dev、カスタムエージェントなどのエージェンティックコーディングツールに簡単に接続できます。
- GitHubリポジトリ:https://github.com/antirez/ds4/ — READMEでセットアップ手順を確認してください。MetalサポートでのコンパイルとDeepSeek V4 Flashの重みのダウンロードが必要と思われます。
- 動画デモ:数時間前にantirezがXにDGX上で動作する動画を投稿しました:https://x.com/antirez/status/2053381973226184749
対象ユーザー
高性能Macハードウェア(例:Mac Studio、M1 Max/UltraまたはM2/M3搭載MacBook Pro)やNVIDIA GPUを持ち、コーディングエージェントや研究のために大規模コンテキストウィンドウを備えたローカルLLMを実行したい開発者向け。
コミュニティへの呼びかけ
Redditの投稿者は、高性能ハードウェアを持つすべての人にこのプロジェクトを試し、テストやバグ報告、AMD GPU向けの最適化などに貢献することを推奨しています。プロジェクトは初期段階にあるため、コミュニティの参加が互換性の加速につながる可能性があります。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Next.js開発のための並列Claudeチャットアーキテクチャ
開発者が、共有データベーステーブルとポーリングエージェントを使用して、同じNext.jsコードベース上で複数のClaude AIチャットを同時に実行するシステムを作成し、1セッションで87%のビルド成功率とゼロのマージコンフリクトを達成しました。

SprintiQ: オープンソースのスプリント計画 for Claude Code
SprintiQは、Claude Codeのオーケストレーションレイヤーとして機能するオープンソースのアジャイルプラットフォームです。AIによるユーザーストーリー生成、スプリント計画、ベロシティ追跡、そしてgitアクティビティをスプリントにリアルタイムで同期するCLIを提供します。

オープンソースおよびセルフホストに焦点を当てた260以上のAIエージェントとツールの厳選リスト
包括的なGitHubリポジトリには、260以上のAIエージェントとフレームワークがリストアップされており、Ollama、OpenClaw、DeerFlowなどのオープンソース、セルフホスト、ローカルファーストのオプションを重視しています。

SpecLock: AIコーディングエージェント向けオープンソース制約エンジン
SpecLockは、Claude CodeなどのAIコーディングエージェントに対して制約を積極的に適用するMCPサーバーです。同義語の拡張、否定検出、破壊的アクションのフラグ付けを使用して、意味的な競合警告で違反をブロックします。