OpenClaw auf 2 modifizierten 2080 Ti lokal mit vLLM hosten: Praxiserfahrung

Ein Reddit-Benutzer auf r/openclaw beschreibt sein Setup für lokales KI-Hosting mit zwei modifizierten 22GB 2080 Ti GPUs, die von Alibaba gekauft und über NVLink verbunden sind, und verwendet vLLM anstelle von Ollama für Tensor-Parallelität. Ziel ist ein Modell mit 20-30B Parametern, und die Community wird um Empfehlungen gebeten, die für leichte Programmierarbeiten, Homelab-Wartung, RAG, E-Mail-Sortierung und Dokumentenerstellung geeignet sind – schwere Programmieraufgaben werden an einen Codex OAuth-Dienst delegiert.
Wichtige Details aus dem Beitrag:
- Hardware: 2x 22 GB (modifizierte) 2080 Ti von Alibaba, wahrscheinlich ehemalige Mining-Karten. NVLink-Brücke verbindet sie.
- Software: vLLM wurde explizit gegenüber Ollama gewählt, um Tensor-Parallelität über beide GPUs zu nutzen.
- Ziel: Ein lokales Modell im Bereich von 20-30B Parametern für OpenClaw ausführen, mit Aufgaben wie leichter Programmierung, Homelab-Verwaltung, RAG, E-Mail-Sortierung und Dokumentengenerierung.
- Benutzer äußern Reue über den Impulskauf und suchen nach Bestätigung oder praktischen Modellvorschlägen.
Die Community-Diskussion (unten verlinkt) bietet Erfahrungsberichte ähnlicher Setups, Modellvorschläge (z. B. CodeLlama, DeepSeek Coder oder Allzweckmodelle wie Mixtral 8x7B) sowie Tipps zur Speicheroptimierung und zum Prompt-Engineering für vLLM. Einige Kommentatoren warnen vor der Zuverlässigkeit der modifizierten GPUs und empfehlen, zuerst mit kleineren Modellen zu testen.
📖 Read the full source: r/openclaw
👀 Siehe auch

Entwickler erstellt 3D-GitHub-Stadtvisualisierung mit Claude Code an einem Tag
Ein Entwickler baute Git City, eine 3D-Visualisierung, bei der GitHub-Nutzer als Pixel-Art-Gebäude erscheinen, deren Höhe auf Commits und Breite auf Repositories basiert, ausschließlich mit Claude Code an einem Tag. Das Projekt verwendet Next.js, Three.js, Supabase und Vercel.

OpenClaw-Agenten-Pipeline, die in einer Woche drei KI-Romane schrieb und veröffentlichte
Ein Entwickler nutzte OpenClaw, um einen Vier-Agenten-Workflow zu erstellen, der in sieben Tagen drei komplette Romane schrieb, bearbeitete und bei Amazon KDP veröffentlichte. Die Pipeline umfasste spezialisierte Agenten für das Schreiben, Bearbeiten, Marketing und die Orchestrierung.

Echte Anwendungsfälle und Entwicklungsmuster für MCP-Server
Ein Entwickler teilt seine Erfahrungen beim Aufbau eines MCP-Servers, der sich mit Live-Sportdatenscannern verbindet, um Quoten von Sportwettenanbietern abzurufen und Preisineffizienzen in Echtzeit zu erkennen. Er diskutiert praktische Erkenntnisse über Tool-Design und Installationsformate.

Selbsthosting von OpenClaw für Slack: Drei Fehlermodi und eine verwaltete Alternative
Ein Entwickler dokumentierte drei gescheiterte Versuche, OpenClaw für Slack selbst zu hosten, wobei er auf WebSocket-Verbindungsabbrüche, Probleme bei der Handhabung von API-Ausfällen und stille Fehler bei der Token-Rotation stieß, bevor er zu SlackClaw.ai, einem Managed Service, wechselte.