Alojamiento local de vLLM en 2x 2080 Ti modificadas para OpenClaw: Experiencia del mundo real

✍️ OpenClawRadar📅 Publicado: 1 de mayo de 2026🔗 Source
Alojamiento local de vLLM en 2x 2080 Ti modificadas para OpenClaw: Experiencia del mundo real
Ad

Un usuario de Reddit en r/openclaw describe su configuración para alojar IA local usando dos GPUs 2080 Ti modificadas de 22GB compradas en Alibaba, conectadas mediante NVLink, y ejecutando vLLM en lugar de Ollama para paralelismo tensorial. Su objetivo es un modelo de 20-30B parámetros y pide recomendaciones de la comunidad para tareas ligeras de coding, mantenimiento de homelab, RAG, clasificación de correos y creación de documentos, dejando las tareas pesadas de coding a un servicio Codex OAuth.

Detalles clave del post:

  • Hardware: 2x 2080 Ti (modificadas) de 22GB de Alibaba, probablemente tarjetas mineras reacondicionadas. Puente NVLink las interconecta.
  • Software: vLLM elegido sobre Ollama explícitamente para aprovechar el paralelismo tensorial entre ambas GPUs.
  • Objetivo: Ejecutar un modelo local en el rango de 20-30B parámetros para OpenClaw, con tareas que incluyen coding ligero, gestión de homelab, RAG, clasificación de correos y generación de documentos.
  • El usuario expresa arrepentimiento de compra y busca validación o sugerencias prácticas de modelos.

La discusión comunitaria (enlazada abajo) ofrece relatos de primera mano de configuraciones similares, recomendaciones de modelos (por ejemplo, CodeLlama, DeepSeek Coder o modelos de propósito general como Mixtral 8x7B) y consejos sobre optimización de memoria e ingeniería de prompts para vLLM. Algunos comentaristas advierten sobre la fiabilidad de las GPUs modificadas y sugieren probar primero con modelos más pequeños.

Ad

📖 Leer la fuente completa: r/openclaw

Ad

👀 Ver también

Claude Orquestrador de Agentes de Código: Colas de Trabajo, Generación de Agentes, Puertas de Verificación
Casos de uso

Claude Orquestrador de Agentes de Código: Colas de Trabajo, Generación de Agentes, Puertas de Verificación

Una publicación en Reddit de r/clawdbot detalla cómo los agentes Claude Code operan una tienda gestionada por IA, manejando diseño, marketing, control de calidad y operaciones 30 veces al día. Enlaza con el Episodio 9 de una serie de blog que explica la canalización del orquestador en producción, incluyendo problemas que no se muestran en las demostraciones.

OpenClawRadar
Kepler construye IA verificable para servicios financieros con Claude: más de 26 millones de documentos indexados, respuestas listas para auditoría
Casos de uso

Kepler construye IA verificable para servicios financieros con Claude: más de 26 millones de documentos indexados, respuestas listas para auditoría

La plataforma de Kepler indexa más de 26 millones de documentos SEC de más de 14,000 empresas, utilizando Claude para razonamiento de múltiples pasos y una capa de verificación determinista que garantiza que cada resultado remita a los documentos fuente.

OpenClawRadar
Puntos de referencia de decodificación especulativa en RTX 3090 con modelos Qwen para uso empresarial en HVAC
Casos de uso

Puntos de referencia de decodificación especulativa en RTX 3090 con modelos Qwen para uso empresarial en HVAC

Un desarrollador probó la decodificación especulativa en una RTX 3090 utilizando modelos Qwen para un bot de Discord de un negocio de HVAC, logrando hasta 279.9 tokens/seg con una aceleración del 236% usando Qwen3-8B con un modelo borrador Qwen3-1.7B.

OpenClawRadar
Autohospedado vs administrado OpenClaw: Comparativa de 4 meses de un desarrollador
Casos de uso

Autohospedado vs administrado OpenClaw: Comparativa de 4 meses de un desarrollador

Un desarrollador cambió de autoalojar OpenClaw durante 4 meses al servicio gestionado de RunLobster por $49/mes. El autoalojamiento requería mantenimiento constante, incluyendo scripts de reconexión, depuración de actualizaciones de configuración y lidiar con facturas sorpresa de API.

OpenClawRadar