vLLM sur 2x 2080 Ti 22 Go : Hébergement local OpenClaw

Un utilisateur de Reddit sur r/openclaw décrit sa configuration pour héberger une IA localement en utilisant deux GPU 2080 Ti modifiées de 22 Go achetées sur Alibaba, reliées par NVLink, et exécutant vLLM plutôt qu'Ollama pour le parallélisme tensoriel. Il vise un modèle de 20 à 30B de paramètres et demande à la communauté des recommandations adaptées à du codage léger, la maintenance d'un homelab, du RAG, le tri des e-mails et la création de documents, les tâches de codage lourdes étant déléguées à un service Codex OAuth.

Détails clés du message :

Matériel : 2x 2080 Ti (modifiées) de 22 Go d'Alibaba, probablement d'anciennes cartes minières. Pont NVLink les interconnecte.
Logiciel : vLLM choisi plutôt qu'Ollama explicitement pour tirer parti du parallélisme tensoriel sur les deux GPU.
Objectif : Exécuter un modèle local dans la gamme de 20 à 30B de paramètres pour OpenClaw, avec des tâches incluant du codage léger, la gestion d'un homelab, du RAG, le tri des e-mails et la génération de documents.
L'utilisateur exprime des regrets d'achat et cherche une validation ou des suggestions pratiques de modèles.

La discussion communautaire (lien ci-dessous) propose des retours d'expérience de configurations similaires, des recommandations de modèles (par exemple, CodeLlama, DeepSeek Coder, ou des modèles généralistes comme Mixtral 8x7B), ainsi que des astuces sur l'optimisation mémoire et l'ingénierie des invites pour vLLM. Certains commentateurs mettent en garde sur la fiabilité des GPU modifiés et suggèrent de tester d'abord avec des modèles plus petits.

📖 Lire la source complète : r/openclaw

Hébergement local de vLLM sur 2x 2080 Ti modifiées pour OpenClaw : Expérience réelle

👀 See Also

Utiliser Obsidian avec OpenClaw comme configuration de second cerveau

Claude Code conçoit des cartes de visite imprimables via HTML + Playwright

Cas pratiques d'OpenClaw tirés de l'expérience quotidienne

Le modèle Qwen 27B démontre de solides performances pour l'analyse de lore en contexte long