Hébergement local de vLLM sur 2x 2080 Ti modifiées pour OpenClaw : Expérience réelle

Un utilisateur de Reddit sur r/openclaw décrit sa configuration pour héberger une IA localement en utilisant deux GPU 2080 Ti modifiées de 22 Go achetées sur Alibaba, reliées par NVLink, et exécutant vLLM plutôt qu'Ollama pour le parallélisme tensoriel. Il vise un modèle de 20 à 30B de paramètres et demande à la communauté des recommandations adaptées à du codage léger, la maintenance d'un homelab, du RAG, le tri des e-mails et la création de documents, les tâches de codage lourdes étant déléguées à un service Codex OAuth.
Détails clés du message :
- Matériel : 2x 2080 Ti (modifiées) de 22 Go d'Alibaba, probablement d'anciennes cartes minières. Pont NVLink les interconnecte.
- Logiciel : vLLM choisi plutôt qu'Ollama explicitement pour tirer parti du parallélisme tensoriel sur les deux GPU.
- Objectif : Exécuter un modèle local dans la gamme de 20 à 30B de paramètres pour OpenClaw, avec des tâches incluant du codage léger, la gestion d'un homelab, du RAG, le tri des e-mails et la génération de documents.
- L'utilisateur exprime des regrets d'achat et cherche une validation ou des suggestions pratiques de modèles.
La discussion communautaire (lien ci-dessous) propose des retours d'expérience de configurations similaires, des recommandations de modèles (par exemple, CodeLlama, DeepSeek Coder, ou des modèles généralistes comme Mixtral 8x7B), ainsi que des astuces sur l'optimisation mémoire et l'ingénierie des invites pour vLLM. Certains commentateurs mettent en garde sur la fiabilité des GPU modifiés et suggèrent de tester d'abord avec des modèles plus petits.
📖 Lire la source complète : r/openclaw
👀 See Also

OpenClaw Family Gateway : Budgets de jetons, réglage de la mémoire et plugins personnalisés
Un développeur a construit une passerelle IA familiale en utilisant OpenClaw sur un Mac et un NAS QNAP, en mettant en œuvre des budgets stricts de tokens, en ajustant la récupération de mémoire avec un reclassement et des embeddings contextuels, et en créant 12 plugins personnalisés avec plus de 175 commandes.

Claude Opus 4.6 corrige un jeu Windows 16 bits pour les systèmes modernes
Claude Opus 4.6 a contribué à corriger le jeu Tonka Construction de 1999 pour qu'il fonctionne sur les versions modernes de Windows en modifiant WING32.dll pour traduire les appels hérités, de manière similaire à DXVK. Cette correction élimine le besoin de DOSBox et d'installations de pilotes qui rendaient auparavant le jeu difficile à jouer.

Développeur crée une application bancaire macOS avec Claude Code en 6 semaines
Un développeur a créé simplebanking, une application macOS gratuite et open-source pour la barre de menus destinée aux banques allemandes en utilisant Claude Code. L'application affiche les soldes en direct sur plusieurs comptes, propose une recherche de transactions, une détection d'abonnements et conserve toutes les données localement.

Construction d'un système d'agent IA autonome avec Claude Code : une étude de cas
Un développeur a créé Acrid, un agent IA autonome qui dirige une entreprise appelée Acrid Automation en utilisant Claude Code comme système d'exploitation. Le système comprend 14 compétences sous forme de commandes slash, 4 sous-agents pour la délégation, une mémoire basée sur des fichiers sans bases de données vectorielles, et un pipeline de contenu automatisé reliant Claude à n8n via GitHub.