Utilyze: Монитор GPU с открытым исходным кодом, измеряющий реальную вычислительную пропускную способность, а не только активность ядра

Стандартный показатель использования GPU, применяемый в nvidia-smi, nvtop, Weights & Biases, Amazon CloudWatch, Google Cloud Monitoring и Azure Monitor, вводит в заблуждение. Он сообщает долю времени, в течение которого выполняется любое ядро, поэтому GPU может показывать 100% загрузку, используя всего 1-10% реальной вычислительной мощности. Команды, полагающиеся на этот показатель для планирования мощностей, могут считать системы перегруженными, когда на самом деле они недогружены.
Utilyze
Компания SysTalize выпустила Utilyze (utlz) — инструмент с открытым исходным кодом (Apache 2.0), который измеряет использование GPU иначе. Вместо активности ядер он берет образцы аппаратных счетчиков производительности и сообщает вычислительную и памятьную пропускную способность относительно теоретических пределов оборудования. Также он оценивает достижимый потолок использования для данной рабочей нагрузки.
Установка
curl -fsSL https://systalyze.com/utilyze/install.sh | bash
Utilyze работает в реальном времени параллельно с любой AI-нагрузкой с незначительными накладными расходами. В производственных развертываниях он выявил порядковые различия в запасе производительности в системах, которые стандартные инструменты объявляли полностью загруженными.
Почему это важно
Вычислительные ресурсы AI дефицитны: годовые контракты аренды H100 выросли примерно на 40% с октября 2025 по март 2026, а сроки поставки GPU растягиваются на месяцы. Огромные средства тратятся впустую на ненужное оборудование и энергию. Точное измерение — необходимое условие для оптимизации: каждый процентный пункт восстановленной реальной пропускной способности экономит деньги и ресурсы.
Репозиторий на GitHub: https://github.com/systalyze/utilyze
📖 Читать полный источник: HN LLM Tools
👀 Смотрите также

Соперничающий обзор: Межмодельный цикл оценки планов ИИ-агентов
Rival-review — это инструмент с лицензией MIT, который использует вторую модель ИИ для проверки планов от основного агента ИИ-кодирования перед выполнением, выявляя такие проблемы, как ошибочные планы отката, уязвимости безопасности и решения на устаревших данных.

Экранбокс: Открытый код виртуальных рабочих столов для ИИ-агентов, полностью созданных голосом
Screenbox предоставляет изолированные Linux-рабочие столы в Docker для AI-агентов, решая конфликты при параллельном запуске нескольких агентов. Проект был полностью создан с помощью голосовых команд в Claude Code, и создатель не видел ни одной строки кода.

Сервер MCP GodotIQ предоставляет ИИ-агентам пространственное понимание сцен Godot
GodotIQ — это MCP-сервер, который предоставляет агентам для кодирования истинное понимание 2D/3D-сцен, сигналов и зависимостей кода в Godot. В ходе теста он автономно создал игру в жанре twin-stick survivors за один час, используя ресурсы и подсказку.

Прокси-сервер ClawCut выпущен на GitHub для оптимизации OpenClaw под небольшие языковые модели.
ClawCut — это экспериментальный прокси, который манипулирует, внедряет JSON-вызовы и удаляет лишние JSON-данные из OpenClaw, чтобы снизить когнитивную нагрузку на небольшие модели (7B-8B), работающие на ограниченном оборудовании.