OpenClaw Lokaler Agent mit TurboQuant-Caching für Mittelklasse-Hardware

✍️ OpenClawRadar📅 Veröffentlicht: 21. April 2026🔗 Source
OpenClaw Lokaler Agent mit TurboQuant-Caching für Mittelklasse-Hardware
Ad

Das OpenClaw-Team hat eine One-Click-Anwendung veröffentlicht, die es ermöglicht, lokale agentische Modelle auf Mittelklasse-Hardware wie dem MacBook Air mit 16 GB RAM und dem Mac Mini laufen zu lassen. Die Implementierung adressiert die Herausforderung, anspruchsvolle Agentenmodelle (wie QWEN oder GLM) auf durchschnittlicher Hardware laufen zu lassen, indem sie TurboQuant-Cache-Kompression und einen Kontextvorwärmungsprozess integriert.

Technische Implementierungsdetails

Die Lösung baut auf mehreren Schlüsselkomponenten auf:

  • TurboQuant-Caching: Verwendet Tom Turneys llama.cpp TurboQuant-Implementierung, die gepatcht wurde, um korrekt mit agentischem Tool-Calling in QWEN-Modellen zu funktionieren.
  • Kontext-Caching/Vorwärmung: Implementiert einen OpenClaw-spezifischen "Aufwärm"-Prozess, der einige Minuten nach dem Modellstart dauert, aber danach eine reibungslose Anfrageverarbeitung auf eingeschränkter Hardware ermöglicht.
  • Modellunterstützung: Getestet mit Googles Gemma 4 Reasoning-Modell und QWEN 3.5, wobei beide ähnliche Leistung auf Standard-M4-Maschinen erzielen.
Ad

Leistungsbenchmarks

Aus Tests auf einem MacBook Air mit 16 GB Arbeitsspeicher:

  • Verarbeitungsgeschwindigkeit: Sowohl Gemma 4 als auch QWEN 3.5 liefern etwa 10-15 Tokens pro Sekunde (tps)
  • Geschwindigkeitsvergleich: QWEN zeigt eine leicht schnellere Leistung als Gemma 4
  • Reasoning-Leistung: Vergleichbar zwischen den beiden Modellen, obwohl keines für komplexe Aufgaben oder Programmierung an Anthropic-Modelle heranreicht
  • Cloud-Vergleich: Antworten sind 2-3 mal langsamer als leistungsstarke Cloud-Modelle

Praktische Anwendungen

Die Implementierung macht lokale Agenten praktikabel für:

  • Alltägliche Aufgaben, bei denen Geschwindigkeit nicht kritisch ist
  • Hintergrundprozesse auf erschwinglicher Hardware (z.B. 600 $ Mac Mini)
  • 24/7 lokale Agentenbereitstellung, die sich innerhalb von Monaten amortisieren kann

Das Team merkt an, dass die Reasoning-Leistung für komplexe Aufgaben zwar noch nicht an erstklassige Cloud-Modelle heranreicht, dies jedoch einen bedeutenden Schritt in Richtung praktischer lokaler Agentenbereitstellung auf Consumer-Hardware darstellt.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Gemeinschaftlich gewähltes Modell-Ranking für OpenClaw veröffentlicht.
Werkzeuge

Gemeinschaftlich gewähltes Modell-Ranking für OpenClaw veröffentlicht.

Ein neues, von der Community gewähltes Ranking für Modelle, die mit OpenClaw kompatibel sind, ist jetzt verfügbar, wobei Opus 4.5 derzeit an der Spitze steht.

OpenClawRadar
Claude Code Plugin analysiert Token-Verschwendung und Anomalien lokal
Werkzeuge

Claude Code Plugin analysiert Token-Verschwendung und Anomalien lokal

Ein Entwickler hat ein Claude Code Plugin erstellt, das Token-Verschwendung diagnostiziert, indem es sechs Anomaliearten aus lokalen Sitzungsdaten erkennt. Das Tool analysierte 8.392 Sitzungen und fand 1.015 Anomalien, wobei ExcessiveToolUse am häufigsten auftrat.

OpenClawRadar
Verbesserter Claude-Code-Telegram-Plugin fügt Sprache, Sticker und Threading hinzu
Werkzeuge

Verbesserter Claude-Code-Telegram-Plugin fügt Sprache, Sticker und Threading hinzu

Ein Entwickler hat einen Fork des offiziellen Claude Code Telegram-Plugins veröffentlicht, der Transkription von Sprachnachrichten via Whisper, Sticker/GIF-Unterstützung, Konversations-Threading und Emoji-Reaktionen hinzufügt. Es ist ein Drop-in-Ersatz, der nur Klonen, Kopieren einer Datei und Neustarten erfordert.

OpenClawRadar
iKnowKungFu Skill analysiert die Verwendung von OpenClaw, um fehlende Fähigkeiten zu empfehlen
Werkzeuge

iKnowKungFu Skill analysiert die Verwendung von OpenClaw, um fehlende Fähigkeiten zu empfehlen

iknowkungfu ist eine neue OpenClaw-Fähigkeit, die den Arbeitsbereich, Speicherdateien und Konversationsprotokolle Ihres Agenten scannt, um basierend auf Ihren tatsächlichen Nutzungsmustern zu identifizieren, welche Fähigkeiten Ihnen fehlen. Es bietet spezifische Empfehlungen mit Vertrauenswerten und Begründungen, die an Ihren Arbeitsablauf geknüpft sind.

OpenClawRadar