Qwen3.6:27b + Custom Go-Agent: Eine lokale Alternative zu Claude Code

✍️ OpenClawRadar📅 Veröffentlicht: 15. Mai 2026🔗 Source

Ein Entwickler (codehamr), der ein Geschäft mit lokalen LLM-Integrationen betreibt, beschreibt Experimente mit lokalen Modellen als Fallback für Claude Code. Er berichtet, dass Qwen3.6:27b bei Q8 auf einer RTX 6000 mit 96 GB und 128k Kontext eine ähnliche Programmiererfahrung wie Claude Code bietet, und stellt fest, dass eine Consumer-RTX 5090 mit 32 GB bei Q4_M vergleichbare Ergebnisse erzielen kann.

Für die Agentenebene hat er ein minimales, einzelnes Go-Binary namens codehamr (MIT Open Source) erstellt – keine Plugins, kein MCP, keine Themes. Der Agent erledigt Suche, Abhängigkeiten und Dateiarbeiten über Bash bei Bedarf. Das Repository ist verfügbar unter: https://github.com/codehamr/codehamr

Wichtige Details

Modell: Qwen3.6:27b bei Q8-Quantisierung, läuft auf RTX 6000 (96 GB) mit 128k Kontext – überdimensioniert für ein 30B-Modell.
Consumer-Alternative: RTX 5090 (32 GB) bei Q4_M sollte mit guter Prompt-Disziplin eine ähnliche Programmiererfahrung bieten.
Agent-Build: Benutzerdefiniertes Go-Binary – minimal, keine Plugins, kein MCP. Verwendet Bash für Suche, Abhängigkeiten, Dateioperationen.
Lizenz: MIT Open Source, zum Forken oder Ignorieren verfügbar.

Der Entwickler betont, dass jeder Schritt in Richtung lokaler LLMs die Abhängigkeit von Cloud-Tools reduziert. Dieses Setup ist in Kombination mit disziplinierter Prompt-Gestaltung die erste lokale Konfiguration, bei der er Claude Code nicht vermisst.

📖 Read the full source: r/LocalLLaMA

👀 Siehe auch

Werkzeuge

Log Reducer MCP Server reduziert Token-Verbrauch, wenn Claude Code Protokolle liest

Log Reducer ist ein MCP-Server, der Logdateien serverseitig verarbeitet, bevor er reduzierte Ausgaben an Claude Code sendet, wodurch Rohlogs im Kontextfenster vermieden werden. Er wendet 19 deterministische Transformationen an, die Logs um 50-90% komprimieren, wobei ein 2000-Zeilen-Log über 20.000+ Token aus Sitzungen entfernt.

14. März 2026, 08:45 UTC

OpenClawRadar

Werkzeuge

Warum deterministische Workflows die KI-gesteuerte Orchestrierung für Agentensysteme übertreffen

Ein Entwickler mit einem Jahr Erfahrung im Aufbau von Agentensystemen teilt mit, dass KI-gesteuerte Orchestrierung aufgrund nicht-deterministischer Routing-Entscheidungen, sich aufschaukelnder Fehler, explodierender Kosten und unmöglicher Fehlersuche nicht zuverlässig funktionierte. Der Wechsel zu deterministischen Workflows mit codebasierter Orchestrierung beseitigte die Orchestrierungsfehler.

14. Apr. 2026, 09:45 UTC

OpenClawRadar

Werkzeuge

Claude Code undokumentierte Funktionen: Hooks, Memory, YOLO-Klassifikator und mehr

Der Claude Code-Quellcode enthüllt verborgene Konfigurationen: YOLO-Klassifikator zur automatischen Genehmigung, Hooks, die Befehle umschreiben, persistentes Agentengedächtnis, Auto-Modus-Regeln in einfachem Englisch und Traumschleifen.

29. Mai 2026, 12:16 UTC

OpenClawRadar

Werkzeuge

Identitäts- und Reputationsschicht für OpenClaw-Agenten

Ein Entwicklerteam hat MCP-I und IdentiClaw entwickelt, um Identitätsverlust in mehrstufigen Agenten-Workflows zu lösen, sowie knowthat.ai als Reputationsregister. Sie haben die MCP-I-Spezifikation an die Decentralized Identity Foundation gespendet.

15. Apr. 2026, 09:42 UTC

OpenClawRadar