SpruceChat exécute un LLM de 0,5 milliard de paramètres directement sur les consoles portables Miyoo grâce à llama.cpp.

Ce que c'est
SpruceChat est un projet qui exécute le modèle de langage Qwen2.5-0.5B entièrement sur l'appareil sur plusieurs consoles de jeu portables en utilisant llama.cpp. Il ne nécessite aucune connexion cloud ou WiFi après la configuration initiale.
Détails clés
Le modèle réside en RAM après le premier démarrage, et les tokens s'affichent un par un pendant la génération. Il fonctionne sur le Miyoo A30, le Miyoo Flip, le Trimui Brick et le Trimui Smart Pro.
Performances sur le Miyoo A30 (qui possède un processeur quadricœur Cortex-A7) :
- Chargement du modèle : ~60 secondes au premier démarrage
- Vitesse de génération : ~1-2 tokens par seconde
- Évaluation de l'invite : ~3 tokens par seconde
Le développeur note que ce n'est pas rapide, mais il diffuse en continu pour que vous puissiez le voir réfléchir. Il mentionne que les appareils 64 bits sont plus rapides.
L'IA est décrite comme ayant "la personnalité d'un épicéa : patient, sans hâte, tranquillement émerveillé par tout."
Si l'appareil est connecté au WiFi, vous pouvez également accéder au serveur llama depuis un navigateur sur un téléphone ou un ordinateur portable pour discuter avec un vrai clavier.
Le dépôt se trouve à https://github.com/RED-BASE/SpruceChat. Le projet a été construit avec l'aide de Claude, et il y a déjà un collaborateur qui travaille à étendre la prise en charge des appareils. La première version est disponible avec des binaires armhf et aarch64, et le modèle est inclus.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

free-claude-code ajoute la prise en charge de GLM-5 via NVIDIA NIM, et s'étend à OpenRouter et Discord
free-claude-code prend désormais en charge GLM-5 via le niveau gratuit de NVIDIA NIM (40 requêtes/min) et ajoute l'intégration OpenRouter, la prise en charge des bots Discord et la compatibilité avec le fournisseur local LMStudio. L'outil convertit les requêtes API Anthropic de Claude Code pour fonctionner avec des backends de modèles alternatifs.

OpenClaw : Révolutionner la maintenance des sites web grâce à une surveillance continue
OpenClaw, une agence innovante pilotée par l'IA, redéfinit la maintenance des sites web en opérant sans relâche 24h/24 et 7j/7. En exploitant une automatisation avancée, elle garantit un fonctionnement optimal du site et traite rapidement les problèmes.

Corbeau : La plateforme MCP open-source ajoute une mémoire persistante et un partage pair-à-pair aux interfaces LLM.
Crow est une plateforme de serveur MCP open-source et auto-hébergée qui fournit aux interfaces LLM une mémoire persistante basée sur SQLite, des outils de recherche structurés et un partage pair-à-pair chiffré. Il fonctionne avec tout client compatible MCP comme Claude Desktop, Cursor ou Windsurf et ne nécessite aucune dépendance cloud par défaut.

Automatisation des Notes de Version de Claude Desktop à partir d'Applications Electron Minifiées
Un développeur a créé un pipeline automatisé utilisant Claude Sonnet et Opus 4.6 pour générer des notes de version pour Claude Desktop sur Linux, comblant ainsi l'absence de notes de version officielles de la part d'Anthropic. Le système extrait, normalise et analyse le code minifié de l'application Electron dans le cadre d'un flux de travail CI/CD.