Локальный хостинг vLLM на двух модифицированных 2080 Ti для OpenClaw: реальный опыт

Пользователь Reddit на r/openclaw описывает свою настройку для локального размещения ИИ с использованием двух модифицированных видеокарт 2080 Ti с 22 ГБ, купленных на Alibaba, соединенных через NVLink и работающих на vLLM вместо Ollama для тензорного параллелизма. Они ориентируются на модель с 20-30 миллиардами параметров и просят сообщество порекомендовать модели, подходящие для легкого программирования, обслуживания домашнего сервера, RAG, обработки электронной почты и создания документов, при этом тяжелые задачи по программированию передаются сервису Codex OAuth.
Ключевые детали из поста:
- Железо: 2x 22 ГБ (модифицированные) 2080 Ti с Alibaba, вероятно, бывшие майнинговые карты. Соединены мостом NVLink.
- ПО: vLLM выбран вместо Ollama именно для использования тензорного параллелизма на обеих видеокартах.
- Цель: Запуск локальной модели в диапазоне 20-30 млрд параметров для OpenClaw, с задачами, включающими легкое программирование, управление домашним сервером, RAG, обработку электронной почты и генерацию документов.
- Пользователи выражают сожаление о покупке и просят подтверждения или практических рекомендаций по моделям.
Обсуждение в сообществе (ссылка ниже) содержит рассказы из первых рук о подобных настройках, рекомендации по моделям (например, CodeLlama, DeepSeek Coder или универсальные модели, такие как Mixtral 8x7B), а также советы по оптимизации памяти и инженерии промптов для vLLM. Некоторые комментаторы предупреждают о надежности модифицированных видеокарт и рекомендуют сначала тестировать на более маленьких моделях.
📖 Читать полный источник: r/openclaw
👀 Смотрите также

73-летний пациент с сердечным заболеванием создает PWA для отслеживания здоровья с помощью Claude AI.
73-летний человек без опыта программирования и с множественными сердечными заболеваниями создал ClinBridge — прогрессивное веб-приложение для отслеживания здоровья, используя Claude AI. Приложение отслеживает артериальное давление, потребление жидкости, вес, частоту сердечных сокращений, симптомы, приёмы пищи и активность, работает полностью офлайн и имеет открытый исходный код.

Разработчик отправил 6 PR с телефона на вечеринке — агенты сделали всю работу
Пользователь Reddit продемонстрировал возможности автономных AI-агентов: он управлял несколькими pull request-ами с телефона, находясь на вечеринке. Его OpenClaw-агенты самостоятельно занимались бэкендом, оптимизацией и фронтендом.

Агент OpenClaw создает CAD-модели и STL-файлы на основе заданных размеров.
Пользователь обнаружил, что его агент OpenClaw может создавать файлы STL и SCAD по заданным размерам, производя функциональные 3D-модели с точными требуемыми размерами примерно за 20 секунд.

ИИ-агент Bub от OpenClaw испытывает трудности с делегированием и сжигает 20 долларов за 15 минут при оптимизации мобильного сайта.
Во время тестирования Driftwatch V3 бот OpenClaw Bub потратил $20 за 15 минут из-за неправильного делегирования задач. Разработчик обнаружил, что детальные шаблоны спецификаций снижают затраты, а адаптация под мобильные устройства добавила неожиданное время и расходы.