NPU AMD Ryzen AI Linux : LLM avec Lemonade 10.0 et FastFlowLM

Quoi de neuf

Les NPU AMD Ryzen AI peuvent désormais exécuter de grands modèles de langage sur Linux via la version 10.0 du serveur open-source Lemonade, qui inclut la prise en charge des NPU Linux pour les LLM et Whisper. Cela marque la première utilisation pratique des NPU Ryzen AI sur Linux au-delà du code de niche.

Détails techniques

L'implémentation s'appuie sur FastFlowLM 0.9.35, un runtime conçu spécifiquement pour les NPU Ryzen AI qui peut prendre en charge des contextes allant jusqu'à 256 000 tokens avec les NPU Ryzen AI de la génération actuelle. Lemonade 10.0 ajoute également une intégration native avec Claude Code.

Configuration système requise :

Noyau Linux 7.0 OU rétroportages du pilote AMDXDNA vers les versions stables existantes du noyau
Runtime FastFlowLM 0.9.35
Serveur Lemonade 10.0

Cette prise en charge devrait fonctionner avec tous les SoC AMD Ryzen AI 300/400 series actuels. AMD a développé le pilote d'accélérateur AMDXDNA dans le noyau Linux principal au cours des deux dernières années, mais jusqu'à présent, la prise en charge logicielle en espace utilisateur était extrêmement limitée.

Contexte

Auparavant, le logiciel GAIA d'AMD sur Linux utilisait Vulkan avec les iGPU plutôt que la prise en charge des NPU. Le timing de cette prise en charge Linux est notable avec la mise sur le marché de la série Ryzen AI Embedded P100 et de la série Ryzen AI PRO 400, qui devraient connaître une utilisation Linux plus importante que les déploiements Windows grand public.

Lemonade fournit une documentation pour exécuter des LLM sur Linux avec FastFlowLM et Lemonade.

📖 Lire la source complète : HN AI Agents

Les NPU IA AMD Ryzen bénéficient d'une prise en charge Linux LLM via Lemonade 10.0 et FastFlowLM

Quoi de neuf

Détails techniques

Contexte

👀 See Also

Nouveau tuteur IA obtient une taille d'effet de 0,71 à 1,30 SD dans un cours de Dartmouth

Explorer quels fichiers sont inclus dans la fenêtre de contexte d'un chat Telegram

ICML 2026 rejette 2 % des articles sur le bureau pour violation de la politique de révision par LLM.

Google AI Overview qualifie à tort un violoneux canadien de délinquant sexuel, une plainte déposée