Interface chatbot monopage pour Gemma 4 26B A4B fonctionnant localement

Un développeur a créé une interface de chatbot sur une seule page HTML conçue pour fonctionner avec Gemma 4 26B A4B exécuté localement. L'implémentation se connecte à l'API de LM Studio et fournit une interface complète de chatbot dans un seul fichier HTML.
Implémentation technique
Le système exécute Gemma 4 26B A4B localement avec une fenêtre de contexte de 32K, atteignant 50-65 tokens par seconde. Le modèle est réparti entre deux GPU : un 7900 XT et un 3060 Ti.
Fonctionnalités de l'interface
- Support complet du streaming pour des réponses en temps réel
- Rendu Markdown pour une sortie formatée
- Sélecteur de modèle pour basculer entre les modèles disponibles
- Six curseurs de paramètres pour affiner le comportement du modèle
- Édition des messages avec capacités de branchement de l'historique
- Fonction de régénération pour régénérer les réponses
- Bouton d'interruption pour arrêter la génération en cours de streaming
- Support des invites système pour des instructions personnalisées
Détails du développement
Le développeur note que Claude a été utilisé pour corriger deux bugs DOM que Gemma n'a pas pu résoudre. Tout le reste du travail de développement a été réalisé en utilisant Gemma 4. Le projet est disponible sur GitHub pour examen et utilisation.
Ce type d'interface à page unique est particulièrement utile pour les développeurs travaillant avec des LLM locaux qui souhaitent une interface de chat légère et personnalisable sans la complexité des applications web complexes. L'intégration avec l'API de LM Studio la rend compatible avec divers modèles locaux au-delà de Gemma.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

L'Agent Web TinyFish Surpasse les Concurrents dans les Tests de Performance de Tâches Web
L'agent web TinyFish a atteint un taux de réussite de 81,9 % sur des tâches web difficiles, surpassant nettement des concurrents comme OpenAI Operator à 43,2 %.

Nudge : une application locale qui affiche des plans générés par Claude via des déclencheurs contextuels
Nudge est une application gratuite iOS/Android priorisant le local, qui vous permet de coller des plans en markdown (depuis Claude, ChatGPT, Notes) et d'y ajouter des déclencheurs comme le temps, la localisation, le Wi-Fi, l'inactivité ou une fois pour les faire apparaître via des notifications locales.

Knowledge Raven : Une plateforme de base de connaissances agnostique en modèles, construite avec Claude Code
Knowledge Raven est une plateforme de base de connaissances qui permet à tout LLM compatible MCP de rechercher et citer des documents d'entreprise. L'ensemble de la plateforme a été construit avec Claude Code par un fondateur solo, avec un backend Python/FastAPI, une couche d'outils MCP et un pipeline RAG agentique.

Intégration OpenClaw pour les marchés boursiers indiens : Terminal d'analyse multi-agent et de trading
Un terminal de trading open source pour les marchés indiens a été connecté en tant que serveur de compétences OpenClaw, permettant à tout agent OpenClaw d'extraire les données du marché boursier indien et d'exécuter une analyse complète via HTTP sans installation locale. Le système utilise sept agents spécialisés travaillant en parallèle pour générer une analyse structurée avec des plans de trading.