Utilyze : Moniteur GPU Open Source qui mesure le débit de calcul réel, pas seulement l'activité du noyau

La métrique d'utilisation GPU standard utilisée par nvidia-smi, nvtop, Weights & Biases, Amazon CloudWatch, Google Cloud Monitoring et Azure Monitor est trompeuse. Elle rapporte la fraction de temps pendant laquelle un noyau est en cours d'exécution, de sorte qu'un GPU peut afficher une utilisation à 100 % tout en n'utilisant que 1 à 10 % de la capacité de calcul réelle. Les équipes qui se fient à cette métrique pour la planification de capacité peuvent penser que les systèmes sont saturés alors qu'ils sont en réalité sous-utilisés.
Utilyze
SysTalize a publié Utilyze (utlz), un outil open-source (Apache 2.0) qui mesure l'utilisation GPU différemment. Au lieu de l'activité des noyaux, il échantillonne les compteurs de performance matériels et rapporte le débit de calcul et de mémoire par rapport aux limites théoriques du matériel. Il estime également un plafond d'utilisation atteignable pour une charge de travail donnée.
Installation
curl -fsSL https://systalyze.com/utilyze/install.sh | bash
Utilyze s'exécute en parallèle de toute charge de travail IA en temps réel avec une surcharge négligeable. En production, il a révélé des marges de performance d'ordre de grandeur dans des systèmes que les outils standard déclaraient complètement saturés.
Pourquoi C'est Important
La puissance de calcul IA est rare : les contrats de location annuelle de H100 ont augmenté d'environ 40 % entre octobre 2025 et mars 2026, et les délais d'obtention des GPU s'étendent sur des mois. Les dépenses gaspillées en matériel et en énergie inutiles sont massives. Une mesure précise est un prérequis pour l'optimisation — chaque point de pourcentage de débit réel récupéré permet d'économiser de l'argent et des ressources.
Consultez le dépôt GitHub : https://github.com/systalyze/utilyze
📖 Lire la source complète : HN LLM Tools
👀 See Also

HolyCode : Conteneur Docker pour des environnements d'agents d'IA de codage persistants
HolyCode est un conteneur Docker qui fournit un environnement de développement persistant pour les agents d'IA de codage, conservant les sessions, paramètres et extensions entre les reconstructions. Il inclut des outils de navigation préconfigurés pour les flux de travail des agents et prend en charge Claude, OpenAI, Gemini et d'autres fournisseurs via OpenCode.

Traduire en fr : Schéma AGENTS.md pour les bases de connaissances compilées par LLM avec couche d'apprentissage
AGENTS.md v1.0 fournit un standard de schéma pour que Claude construise et maintienne des wikis de recherche personnels à partir de sources brutes, incluant une couche d'apprentissage par répétition espacée avec génération automatique de flashcards et suivi des lacunes de connaissances.

Rukuzu : Porter une base de données de graphes en C++ de 200 000 lignes vers Rust avec des tests systématiques
Le projet Rukuzu décrit une méthodologie pour porter la base de données de graphes embarquée kuzu, écrite en C++ avec 200 000 lignes de code, vers Rust. Il utilise une commande personnalisée Claude Code pour maintenir simultanément les deux versions et vérifier la justesse via plus de 2 700 tests.

TRELLIS.2 Image-to-3D Porté pour Fonctionner en Natif sur Apple Silicon
Un développeur a adapté le modèle TRELLIS.2 de Microsoft, qui génère des modèles 3D à partir d'images avec 4 milliards de paramètres, pour qu'il fonctionne nativement sur Apple Silicon via PyTorch MPS, en remplaçant les opérations spécifiques à CUDA par des alternatives purement PyTorch. Cette adaptation génère des maillages d'environ 400 000 sommets à partir de photos uniques en environ 3,5 minutes sur un M4 Pro avec 24 Go de mémoire.