Qwen3.6:27b + Agent Go personnalisé : une alternative locale à Claude Code

Un développeur (codehamr) qui gère une entreprise d'intégration de LLM locaux décrit ses expériences avec des modèles locaux comme solution de repli pour Claude Code. Il rapporte que Qwen3.6:27b en Q8 sur un RTX 6000 avec 96 Go et 128k de contexte offre une expérience de codage similaire à Claude Code, et note qu'un RTX 5090 grand public avec 32 Go en Q4_M peut obtenir des résultats comparables.
Pour la couche agent, il a développé un binaire Go minimal et unique nommé codehamr (licence MIT open source) — sans plugins, sans MCP, sans thèmes. L'agent gère les recherches, les dépendances et les opérations sur fichiers via bash à la demande. Le dépôt est disponible à l'adresse : https://github.com/codehamr/codehamr
Points clés
- Modèle : Qwen3.6:27b en quantification Q8, exécuté sur RTX 6000 (96 Go) avec 128k de contexte — excessif pour un modèle de 30B.
- Alternative grand public : RTX 5090 (32 Go) en Q4_M devrait offrir une expérience de codage similaire avec une bonne discipline de prompt.
- Construction de l'agent : Binaire Go personnalisé — minimal, sans plugins, sans MCP. Utilise bash pour la recherche, les dépendances et les opérations sur fichiers.
- Licence : MIT open source, disponible pour fork ou ignore.
Le développeur souligne que chaque pas vers les LLM locaux réduit la dépendance aux outils cloud. Cette configuration, combinée à une discipline de prompt rigoureuse, est la première configuration locale où il ne regrette pas Claude Code.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Application macOS gratuite de la barre de menus affiche les statistiques d'utilisation Claude en temps réel via le décryptage de cookies SQLite
Claude Usage Tracker est une application gratuite pour la barre de menus macOS qui lit les cookies SQLite cryptés de l'application de bureau Claude, les décrypte via le trousseau, et affiche le pourcentage de session, la limite hebdomadaire, les dépenses et les exécutions de routine localement — aucune clé API nécessaire.

engram : plugin de mémoire Claude avec capture à seuil de saillance et cycles de rêve
engram est un plugin de mémoire pour Claude qui filtre les observations au moment de la capture en utilisant 5 dimensions de saillance, ne conservant que les événements à score élevé dans SQLite sans appels LLM pour le scoring. Il propose une injection automatique via 5 crochets et des cycles de rêve qui extraient les workflows récurrents à la fin de la session.

Système à 2 invites pour transporter le contexte entre les discussions Claude sans gaspillage de jetons
Un développeur partage deux prompts pour compresser l'intégralité d'une conversation Claude en un bloc de contexte structuré et le charger dans un nouveau chat, préservant les décisions, le travail et les prochaines étapes.

Développeur Construit un Serveur MCP Power Automate avec 108 Outils et Support Multi-Plateforme
Un développeur a créé un serveur MCP Power Automate qui est passé de 12 à 108 outils, couvrant les opérations CRUD Dataverse via OData, la gestion SharePoint via Graph, le versionnement des Power Apps, l'administration des environnements, et la prise en charge multiplateforme pour Windows, macOS et Linux.