Utilyze: カーネルアクティビティだけでなく実際の計算スループットを測定するオープンソースGPUモニタ

nvidia-smi、nvtop、Weights & Biases、Amazon CloudWatch、Google Cloud Monitoring、Azure Monitorで使用される標準的なGPU利用率メトリクスは誤解を招きます。これはカーネルが実行されている時間の割合を報告するため、GPUは実際の計算能力の1〜10%しか使用していないにもかかわらず、100%の利用率を示すことがあります。これに依存してキャパシティプランニングを行うチームは、システムが実際には過小利用されているのに飽和していると考えるかもしれません。
Utilyze
SysTalizeは、GPU利用率を異なる方法で測定するオープンソース(Apache 2.0)ツールであるUtilyze(utlz)をリリースしました。カーネルアクティビティの代わりに、ハードウェアパフォーマンスカウンターをサンプリングし、ハードウェアの理論限界に対する計算およびメモリスループットを報告します。また、特定のワークロードに対して達成可能な利用率の上限も推定します。
インストール
curl -fsSL https://systalyze.com/utilyze/install.sh | bash
Utilyzeは、任意のAIワークロードと並行してリアルタイムで動作し、オーバーヘッドは無視できる程度です。本番環境での導入では、標準ツールが完全に飽和していると宣言したシステムにおいて、桁違いのパフォーマンス余裕が明らかになりました。
なぜこれが重要か
AIコンピュートは希少です。H100の1年レンタル契約は2025年10月から2026年3月にかけて約40%上昇し、GPUのリードタイムは数ヶ月に及びます。不必要なハードウェアとエネルギーへの浪費は甚大です。正確な測定は最適化の前提条件であり、実際のスループットを1パーセントポイント改善するごとに、コストとリソースの節約につながります。
GitHubリポジトリをチェック: https://github.com/systalyze/utilyze
📖 ソース全文: HN LLM Tools
👀 See Also

MetaBot: オープンソースのブリッジがClaude CodeをTelegram、Feishu、WeChatに接続
MetaBotは、Claude Code Agent SDKをTelegram、Feishu、WeChatなどのメッセージングプラットフォームに接続するオープンソースのTypeScriptブリッジです。永続的なメモリ、スケジュールされたタスク、マルチエージェントコラボレーション、ツール呼び出しのリアルタイムストリーミングを提供します。

RedditユーザーがAIアシスタントから個人の知識をエクスポートするための詳細なプロンプトを共有
Redditユーザーが、AnthropicのChatGPTインポート機能の限界を補うため、ClaudeなどのAIアシスタントから構造化された個人知識を抽出する包括的なプロンプトを作成しました。このプロンプトは、個人知識ベース、知的フレームワーク、知識グラフの3つの異なるJSON成果物を生成します。

OmniCoder-9B:425Kのエージェント軌跡でファインチューニングされた90億パラメータのコーディングエージェント
Tesslateは、Qwen3.5-9Bのハイブリッドアーキテクチャをベースにファインチューニングされた90億パラメータのコーディングエージェントモデル「OmniCoder-9B」をリリースしました。このモデルは、Claude Opus 4.6、GPT-5.4、GPT-5.3-Codex、Gemini 3.1 Proから収集された42万5,000以上の厳選されたエージェント的コーディング軌跡でトレーニングされています。

エージェントファクトリー:オンライン問題議論からAIエージェントを構築する自律システム
Agent Factoryは、Reddit、HN、GitHub、Twitterから実際の問題をスクレイピングし、需要、市場ギャップ、実現可能性でスコアリングし、有望なアイデアに対してスタンドアロンのAIエージェントを構築する自律システムです。このシステムは、7つのツールを備えた最小限のNext.jsテンプレートを使用し、シェルスクリプト経由でClaude Codeをヘッドレスで実行します。