Praktische Lehren aus dem Einsatz von OpenClaw in fünf Unternehmen

Ein Entwickler mit fünf OpenClaw-Instanzen im Produktivbetrieb auf Hetzner VPS teilt konkrete Erkenntnisse aus echten Geschäftseinsätzen.
Infrastrukturentscheidungen
Der Entwickler testete lokale Bereitstellung (am einfachsten, aber nicht skalierbar) und AWS (teuer), bevor er sich für Hetzner CPX22 zu 13 €/Monat (3 vCPU, 4 GB RAM) entschied, da es günstig, schnell und stabil ist. Eine wichtige Erkenntnis: WhatsApp funktioniert nicht mit Rechenzentrums-IPs, da Meta diese blockiert, was zu zwei verlorenen Tagen bei der Beantragung der Meta Developer App führte. Telegram wurde zum Standard, da seine API toleranter ist als die von WhatsApp.
Jeder Kunde erhält seinen eigenen VPS. Mehrinstanzenfähigkeit wurde früh getestet, aber verworfen, weil ein fehlerhafter Prozess eines Kunden nicht den Agenten eines anderen Kunden beeinträchtigen sollte. Die Isolation wird als 13 €/Monat wert und nicht verhandelbar angesehen.
Onboarding und Personalisierung
Frühe Agenten waren generisch, aber nicht effektiv. Der Entwickler erstellte ein 26-Fragen-Formular, das in einen n8n-Workflow fließt, der automatisch eine SOUL.md und USER.md für jede Bereitstellung generiert. Das Formular behandelt Geschäftstyp, Tonpräferenzen, was der Agent selbst erledigen vs. eskalieren soll, genutzte Tools, Tagesablauf und Kommunikationsstil. Ein Nutzer berichtete, der Agent sei "sofort nach der Einrichtung nützlich und spezifisch".
Der Entwickler merkt an: "Ein generischer Agent ist ein Produkt. Ein personalisierter ist ein Teammitglied. Und je mehr sie ihn nutzen, desto mehr wird er eingebettet."
Abrechnungsansatz
Was nicht funktioniert: Einrichtungskosten verlangen und hoffen, dass Kunden bleiben. Was funktioniert: 7-tägige kostenlose Testphase mit dem Anthropic API-Key des Entwicklers (Kosten: 5–15 $), danach erhalten Kunden ihren eigenen Key. Der Entwickler führt sie live auf Zoom in etwa 10 Minuten durch die Einrichtung. Kunden sehen die Transparenz und tragen ihre eigenen Kosten. Ein Kunde wechselte in 3 Minuten von Claude zu OpenAI, weil er bereits ein Abonnement hatte.
Modell-Tiering-Strategie
Der Standard-Stack pro Bereitstellung:
- Haiku: Heartbeats, einfache Antworten, Routinechecks (90 % des Volumens)
- Sonnet: Komplexe Aufgaben, mehrstufige Workflows, alles, was Urteilsvermögen erfordert (9 %)
- Opus: Strategisches Denken, hochriskante Entscheidungen (1 %)
Der Entwickler vergleicht dies mit einer typischen Kleinunternehmensstruktur: "Die Visionärin/der Gründer an der Spitze, dann kommen Leute hinzu, um die Vision umzusetzen."
Wichtiger Tipp: Modelle bei jedem Cron-Job festpinnen. Einmal vergessen führte dazu, dass Heartbeats eine Woche lang auf Sonnet liefen und eine Rechnung von 40 $ verursachten.
Technische Optimierung
Nutze das Betriebssystem, nicht das LLM, für mechanische Aufgaben wie Log-Rotation, Neustart von Diensten oder Dateisicherung. Das LLM wird für Entscheidungen aufgerufen, während das Betriebssystem die Mechanik übernimmt. Dies reduzierte den Token-Verbrauch über alle Bereitstellungen um etwa 30 %.
Praktische Anwendungsfälle
- Pflegeagentur: CQC-Compliance-Erinnerungen, Mitarbeiterplanungskonflikte, Richtlinienabfrage (spart ~5 Stunden/Woche)
- Event-Unternehmen: Lead-Erfassung, Follow-up-Sequenzen, Angebotserstellung integriert mit CRM
- SEN-Berater: EHCP-Fristenverfolgung, Kommunikationsvorlagen für Eltern, Terminplanung mit Schulen
- Auto-Detailer (Florida): Terminbuchung, Bewertungs-Follow-ups, Foto-Organisation
- Eigener Agent des Entwicklers: Strategische Planung, Inhaltserstellung, Erinnerung über 4.000+ Workspace-Dateien
Der Entwickler stellt fest: "Keiner von ihnen wollte einen Chatbot. Sie wollten ein Betriebssystem für ihr Geschäft, das zufällig KI nutzt."
📖 Read the full source: r/openclaw
👀 Siehe auch

Claude Excel-Add-on-Benutzerbewertung: Praktische Erfahrungen mit Tabellenkalkulationsaufgaben
Ein Bauunternehmensbesitzer berichtet von positiven Ergebnissen bei der Verwendung von Claudes Excel-Add-on zur Aktualisierung von Angebots- und Auftragskosten-Tabellen und hebt dabei Fehlererkennung und Verbesserungsvorschläge für die Benutzeroberfläche hervor.

Claude Code im Forschungsarbeitsablauf: Praktische Ergebnisse aus dem Schreiben von Fachartikeln
Ein Forscher nutzte Claude Code für Hilfsaufgaben beim Verfassen einer Arbeit und stellte fest, dass es effektiv für die Erstellung publikationsreifer Grafiken aus vagen Anweisungen, die Migration einer Suchumgebung zwischen Codebasen in weniger als einer Stunde und die Formatierung von über 12 Seiten mathematischer Beweise in LaTeX war, wobei es eine übersehene unvollständige Randbedingung erkannte. Es hatte Schwierigkeiten beim Debuggen eines Nebenläufigkeitsproblems, das tatsächlich ein CPU-Zuweisungsproblem war, das im Code oder in den Protokollen nicht ersichtlich war.

Analyse von 7 Jahren Tagebucheinträgen mit einem LLM: RAG vs. Fehlschläge beim Feintuning
Nachdem ein Entwickler seit 2019 ein Tagebuch geführt hatte, fütterte er ein LLM mit über 200 Einträgen, um Muster zu entdecken – RAG scheiterte, Fine-Tuning scheiterte, und der Datenschutz war eine Einschränkung. Der endgültige Ansatz offenbarte zyklische Lebenslektionen alle zwei Jahre.

Entwicklung benutzerdefinierter Bildanalysefähigkeiten in OpenClaw mit lokalen Modellen
Ein Entwickler erstellte eine benutzerdefinierte OpenClaw-Fähigkeit zur Bildanalyse mit Qwen2.5 VL, die lokal über Ollama auf Windows 11 mit WSL läuft, und umging dabei die Bildbeschränkungen der WebUI durch API-Aufrufe und benutzerdefinierte Skripte.