Utilyze: Монитор GPU с открытым исходным кодом, измеряющий реальную вычислительную пропускную способность, а не только активность ядра

Стандартный показатель использования GPU, применяемый в nvidia-smi, nvtop, Weights & Biases, Amazon CloudWatch, Google Cloud Monitoring и Azure Monitor, вводит в заблуждение. Он сообщает долю времени, в течение которого выполняется любое ядро, поэтому GPU может показывать 100% загрузку, используя всего 1-10% реальной вычислительной мощности. Команды, полагающиеся на этот показатель для планирования мощностей, могут считать системы перегруженными, когда на самом деле они недогружены.
Utilyze
Компания SysTalize выпустила Utilyze (utlz) — инструмент с открытым исходным кодом (Apache 2.0), который измеряет использование GPU иначе. Вместо активности ядер он берет образцы аппаратных счетчиков производительности и сообщает вычислительную и памятьную пропускную способность относительно теоретических пределов оборудования. Также он оценивает достижимый потолок использования для данной рабочей нагрузки.
Установка
curl -fsSL https://systalyze.com/utilyze/install.sh | bash
Utilyze работает в реальном времени параллельно с любой AI-нагрузкой с незначительными накладными расходами. В производственных развертываниях он выявил порядковые различия в запасе производительности в системах, которые стандартные инструменты объявляли полностью загруженными.
Почему это важно
Вычислительные ресурсы AI дефицитны: годовые контракты аренды H100 выросли примерно на 40% с октября 2025 по март 2026, а сроки поставки GPU растягиваются на месяцы. Огромные средства тратятся впустую на ненужное оборудование и энергию. Точное измерение — необходимое условие для оптимизации: каждый процентный пункт восстановленной реальной пропускной способности экономит деньги и ресурсы.
Репозиторий на GitHub: https://github.com/systalyze/utilyze
📖 Читать полный источник: HN LLM Tools
👀 Смотрите также
AIttache: MCP-сервер только для чтения, который не может уничтожить вашу продукцию
AIttache — это MCP-сервер с 25+ коннекторами только для чтения (терминал, серверы, погода, Steam), который физически не может ничего изменить — создан для предоставления LLM контекста логов без автономии.

Центр управления Claude: Открытая панель управления для аналитики кода Claude
Claude Command Center — это локальная панель управления, которая читает ваш каталог ~/.claude/ для отображения данных сессий Claude Code, затрат и конфигураций серверов MCP. Полностью создана с использованием Claude Code с бэкендом на Express и фронтендом на React, не требует настройки и работает локально без облачных сервисов или телеметрии.

Подход к самоулучшению памяти в локальных ИИ-агентах
Разработчик делится своим подходом к постоянной памяти для локальных ИИ-агентов, используя файлы markdown в качестве источника истины, оценку эпизодов на основе правил уверенности и эскалацию доверия на основе паттернов одобрения.

Локально-ориентированный ИИ-помощник для подготовки налогов с шифрованием персональных данных, созданный на основе MCP.
Разработчик создал расширение для подачи налоговой декларации для Crow, которое шифрует все персональные данные с помощью AES-256-GCM и работает с любым MCP-совместимым клиентом, включая Claude, ChatGPT, Gemini или локальные модели через Ollama. Система выполняет расчёты для форм 1040, Приложения 1, HSA (8889), образовательных кредитов (8863), самозанятости (Приложение C/SE) и прироста капитала (Приложение D) локально.