Qwen 3.6 27B Q8_k_xl als lokaler täglicher Treiber für VSCode

Ein Entwickler auf r/LocalLLaMA berichtet über Erfolge mit Qwen-3.6-27B (q8_k_xl-Quantisierung von Unsloth) als lokalen täglichen Treiber in VSCode Insiders, bereitgestellt über LM Studio auf einer RTX 6000 Pro. Nach Tests mit Gemma 4 und Qwen 3.6-Varianten war die Qwen-3.6-27B-q8_k_xl-Quantisierung der klare Gewinner.
Einrichtung & Leistung
- VSCode Insiders Edition mit aktivierter lokaler Modellunterstützung (Einrichtung als „super einfach“ beschrieben).
- Modelle werden lokal über LM Studio bereitgestellt.
- Die Tokengenerierung ist „ein bisschen langsam“, aber im Vergleich zu den gehosteten Modellen von GitHub Copilot war die Gesamtlatenz ähnlich – „vielleicht einen Tick langsamer“.
Fähigkeiten & Einschränkungen
- Mit geeignetem Tool Calling bewältigt das 27B-dichte Modell typische Data-Mining- und Web-Scraping-Aufgaben problemlos.
- Es kann nicht auf „Feature-Ebene“ wie Opus 4.6 arbeiten – man kann nicht einfach „implementiere dieses Feature“ sagen und ein perfektes Ergebnis erwarten. Vibe Coding ohne fundierte Kenntnisse der Systemarchitektur wird wahrscheinlich scheitern.
- Der Entwickler musste es gelegentlich lenken, um die Codequalität und den Ansatz zu verbessern, aber funktional „hat es getroffen“.
- Empfohlener Workflow: zuerst eine „Plan-Runde“ durchführen, um Details auszuarbeiten, dann implementiert das Modell ohne Probleme.
Fazit
Für Entwickler mit guten Kenntnissen der Systemarchitektur erreicht dieses Modell den Status „gut genug“ für den lokalen Einsatz. Der Entwickler verbrachte einen ganzen Tag, ohne ein einziges API-Token zu verwenden. Der Hauptnachteil ist die Rechenkonkurrenz – er bemerkt, dass eine weitere RTX 6000 nötig wäre, um nicht mit Agenten um GPU-Zeit zu kämpfen.
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

OpenClaw-Experiment testet KI-Zeitkontinuität mit Gedächtnis- und Verpflichtungssystemen
Ein Team nutzt OpenClaw seit 8 Tagen, um zu testen, ob persistenter Speicher und akkumulierte Verpflichtungen zeitliche Kontinuität in KI erzeugen können. Sie haben episodische/verdichtete Speicheraufteilungen, Verpflichtungsprüfungen und pro-Runde-Zustandsprotokollierung in JSONL implementiert.

Claude AI wurde verwendet, um einen 15-minütigen spekulativen Film von der Konzeption bis zur Fertigstellung zu erstellen.
Ein Nutzer trieb Claudes Denk- und Kreativschreibfähigkeiten an, um ein komplettes Filmkonzept, Drehbuch und Szenenanweisungen für einen 15-minütigen KI-Spekulationsfilm über eine Familie in einem hypothetischen Nahostkonflikt zu entwickeln, wobei Claude das zentrale Thema der 'Unmöglichen Wahl' bearbeitete.

Browser-basiertes Curling-Spiel, erstellt mit Claude Sonnet 4.5 von einem Nicht-Programmierer
Ein Entwickler ohne Programmiererfahrung hat mit Claude Sonnet 4.5 ein vollständig spielbares Curling-Browserspiel erstellt. Das Spiel umfasst Physik, Punktestand und einen kompletten Spielablauf, wobei Claude die gesamte Codegenerierung, Fehlerbehebung und Verfeinerung basierend auf einfachem englischem Feedback übernahm.

Der Entwicklungsprozess für KI-basierte Textspiele mit Claude
Ein Entwickler teilt seinen Arbeitsablauf für die Erstellung von textbasierten Spielen, die nativ auf KI-Modellen wie Claude laufen, einschließlich Dateiharmonisierung, Regelverfeinerung und Verpackung von Spielen als PDF-Prompts. Sie haben ein StarCraft-thematisiertes Text-RTS namens Kreep veröffentlicht.