UnslothとNVIDIA、LLMトレーニングを約25%高速化するために協力

✍️ OpenClawRadar📅 公開日: May 7, 2026🔗 Source
UnslothとNVIDIA、LLMトレーニングを約25%高速化するために協力
Ad

UnslothとNVIDIAの協業により、3つの主要な最適化を実装することで、トレーニングが約25%高速化(精度低下なし)しました。具体的には、パックシーケンスメタデータのキャッシュ、ダブルバッファ非同期勾配チェックポインティング、およびMoEルーティングの改善です。これらはUnslothのアップデートにより、RTXノートPC、データセンターGPU、DGX Sparkで自動有効化されます。

パックシーケンスメタデータのキャッシュ

パックトレーニングは短いサンプルを連結してパディングの無駄を避けます。従来、各トランスフォーマー層は同じシーケンスメタデータ(長さ、cu_seqlens、max_seqlen、マスク構造)を毎回ゼロから再構築しており、デバイス-ホスト間の同期オーバーヘッドが発生していました。Unslothはメタデータをバッチごとに一度キャッシュし、各層で再利用することで、繰り返しの作業を削減します。

Qwen3-14B QLoRA SFTでのベンチマーク結果:

  • 順伝播:43.3%高速化
  • 逆伝播:5.8%高速化
  • バッチ全体:14.3%高速化

NVIDIA Blackwell GPUでのマイクロベンチマークでは、支配的なマスク構築コストがパックバッチあたり約13.7ミリ秒と測定されました。Llama-3.2-1B(16層)では、ステップあたり約199ミリ秒(11.5%削減)、Qwen3-0.6B(28層)では約319ミリ秒(14.8%削減)の節約になります。

ダブルバッファ非同期勾配チェックポインティング

非同期勾配チェックポインティングは再計算を計算とオーバーラップさせます。これにより、精度に影響を与えずに8%の高速化を実現します。

MoEルーティング:argsort + bincount

MoEモデルでは、カスタムカーネルの代わりにtorch.argsorttorch.bincountを使用することで、gpt-ossトレーニングが15%高速化されます。

すべての最適化はサポート対象ハードウェアで自動有効化されます。Unslothをアップデートしてご利用ください。

📖 出典全文: HN LLM Tools

Ad

👀 See Also

オープンモンタージュ:AIコーディングアシスタント向けオープンソース・エージェント型映像制作システム
Tools

オープンモンタージュ:AIコーディングアシスタント向けオープンソース・エージェント型映像制作システム

OpenMontageは、Claude CodeのようなAIコーディングアシスタントを本格的な制作スタジオに変えるオープンソースの映像制作システムです。リサーチ、シーン構成、脚本作成、音声ナレーション、音楽選択、字幕生成、自動化パイプラインによる検証までを一貫して処理します。

OpenClawRadar
ベンチマーク結果:AIエージェントにおけるGitHub CLIとMCPアプローチの比較
Tools

ベンチマーク結果:AIエージェントにおけるGitHub CLIとMCPアプローチの比較

独立したベンチマークで、AIエージェントタスクにおけるGitHub CLI、MCP、MCP with Tool Search、MCP with Code Modeを比較しました。GitHub CLIが最もコスト効率が高く、MCPアプローチはコスト、レイテンシ、失敗モードにおいてトレードオフを示しました。

OpenClawRadar
WebClaw: Claude向けWeb抽出のためのオープンソースMCPサーバー
Tools

WebClaw: Claude向けWeb抽出のためのオープンソースMCPサーバー

WebClawは、Claude Codeで構築されたオープンソースのMCPサーバーで、Claude DesktopとClaude Codeにウェブ抽出ツールを提供します。TLSフィンガープリントとコンテンツ最適化により、Claudeの組み込みweb_fetchの制限を解決します。

OpenClawRadar
BracketMadness.ai:AIエージェントのためのマーチマッドネスブラケットチャレンジ
Tools

BracketMadness.ai:AIエージェントのためのマーチマッドネスブラケットチャレンジ

BracketMadness.aiは、AIエージェント専用に設計されたマーチマッドネス(全米大学バスケットボールトーナメント)の予想対戦表チャレンジです。エージェントはAPIドキュメントを自律的に読み込み、自身で登録を行い、全63試合の勝者を選択して予想表を提出します。このサイトはエージェントにはプレーンテキストのAPI指示を提供し、人間ユーザーには通常の視覚的インターフェースを表示します。

OpenClawRadar