Hospedagem Local vLLM em 2x 2080 Ti Modificadas para OpenClaw: Experiência do Mundo Real

Um usuário do Reddit no r/openclaw descreve sua configuração para hospedagem local de IA usando duas placas de vídeo 2080 Ti modificadas de 22 GB compradas no Alibaba, conectadas via NVLink, e executando vLLM em vez de Ollama para paralelismo de tensores. Eles miram um modelo de parâmetros 20-30B e pedem recomendações da comunidade adequadas para trabalhos leves de codificação, manutenção de homelab, RAG, triagem de e-mails e criação de documentos — com tarefas pesadas de codificação delegadas a um serviço Codex OAuth.
Detalhes principais da postagem:
- Hardware: 2x 2080 Ti (modificadas) de 22 GB do Alibaba, provavelmente placas de mineração usadas. Ponte NVLink as interconecta.
- Software: vLLM escolhido em vez de Ollama explicitamente para aproveitar o paralelismo de tensores em ambas as GPUs.
- Objetivo: Executar um modelo local na faixa de 20-30B de parâmetros para OpenClaw, com tarefas incluindo codificação leve, gerenciamento de homelab, RAG, triagem de e-mails e geração de documentos.
- Usuários expressam arrependimento pós-compra e buscam validação ou sugestões práticas de modelos.
A discussão da comunidade (linkada abaixo) oferece relatos em primeira mão de configurações semelhantes, recomendações de modelos (ex.: CodeLlama, DeepSeek Coder, ou modelos de uso geral como Mixtral 8x7B), e dicas sobre otimização de memória e engenharia de prompt para vLLM. Alguns comentaristas alertam sobre a confiabilidade das GPUs modificadas e sugerem testar com modelos menores primeiro.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Habilidade de Código Claude de Código Aberto para Coordenação de Logística Familiar
Um desenvolvedor criou o Parent Helper, uma habilidade do Claude Code que coordena agendas familiares, planejamento de refeições e otimização de compras usando um único arquivo markdown e integrações MCP. A ferramenta projeta economia de US$ 4,3 mil/ano em compras dividindo listas entre lojas com base no preço.

Construindo uma persona de CEO de IA para o mercado asiático da OpenClaw com pensamento chinês nativo
Um desenvolvedor criou a Eve, uma persona de CEO de IA projetada especificamente para os mercados de HK/TW/CN, abordando o problema de personas em inglês com tradução chinesa de baixa qualidade. A solução inclui três modos de voz separados, decaimento de memória específico para a Ásia, roteamento consciente da plataforma e monitoramento de concorrentes locais.

O agente de IA Bub da OpenClaw tem dificuldade com delegação, gasta US$ 20 em 15 minutos durante a otimização do site móvel.
Durante os testes de QA do Driftwatch V3, o bot OpenClaw Bub queimou US$ 20 em 15 minutos por não delegar tarefas adequadamente. O desenvolvedor descobriu que templates de especificação detalhados reduzem custos, enquanto a adaptação para mobile adicionou tempo e despesas inesperados.

Desenvolvedor Cria Aplicativo de Contabilidade com IA Usando Claude Code
Um desenvolvedor criou o AICountant, um aplicativo de contabilidade com IA para freelancers e pequenas empresas, usando o Claude Code em toda a stack, incluindo Next.js App Router, Prisma com PostgreSQL e armazenamento Vercel Blob. O aplicativo extrai dados de recibos, converte moedas estrangeiras usando taxas de câmbio históricas e organiza tudo em um livro-razão pesquisável.