Interface chatbot monopage pour Gemma 4 26B A4B fonctionnant localement

✍️ OpenClawRadar📅 Publié: April 21, 2026🔗 Source
Interface chatbot monopage pour Gemma 4 26B A4B fonctionnant localement
Ad

Un développeur a créé une interface de chatbot sur une seule page HTML conçue pour fonctionner avec Gemma 4 26B A4B exécuté localement. L'implémentation se connecte à l'API de LM Studio et fournit une interface complète de chatbot dans un seul fichier HTML.

Implémentation technique

Le système exécute Gemma 4 26B A4B localement avec une fenêtre de contexte de 32K, atteignant 50-65 tokens par seconde. Le modèle est réparti entre deux GPU : un 7900 XT et un 3060 Ti.

Fonctionnalités de l'interface

  • Support complet du streaming pour des réponses en temps réel
  • Rendu Markdown pour une sortie formatée
  • Sélecteur de modèle pour basculer entre les modèles disponibles
  • Six curseurs de paramètres pour affiner le comportement du modèle
  • Édition des messages avec capacités de branchement de l'historique
  • Fonction de régénération pour régénérer les réponses
  • Bouton d'interruption pour arrêter la génération en cours de streaming
  • Support des invites système pour des instructions personnalisées
Ad

Détails du développement

Le développeur note que Claude a été utilisé pour corriger deux bugs DOM que Gemma n'a pas pu résoudre. Tout le reste du travail de développement a été réalisé en utilisant Gemma 4. Le projet est disponible sur GitHub pour examen et utilisation.

Ce type d'interface à page unique est particulièrement utile pour les développeurs travaillant avec des LLM locaux qui souhaitent une interface de chat légère et personnalisable sans la complexité des applications web complexes. L'intégration avec l'API de LM Studio la rend compatible avec divers modèles locaux au-delà de Gemma.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

L'Agent Web TinyFish Surpasse les Concurrents dans les Tests de Performance de Tâches Web
Tools

L'Agent Web TinyFish Surpasse les Concurrents dans les Tests de Performance de Tâches Web

L'agent web TinyFish a atteint un taux de réussite de 81,9 % sur des tâches web difficiles, surpassant nettement des concurrents comme OpenAI Operator à 43,2 %.

OpenClawRadar
Nudge : une application locale qui affiche des plans générés par Claude via des déclencheurs contextuels
Tools

Nudge : une application locale qui affiche des plans générés par Claude via des déclencheurs contextuels

Nudge est une application gratuite iOS/Android priorisant le local, qui vous permet de coller des plans en markdown (depuis Claude, ChatGPT, Notes) et d'y ajouter des déclencheurs comme le temps, la localisation, le Wi-Fi, l'inactivité ou une fois pour les faire apparaître via des notifications locales.

OpenClawRadar
Knowledge Raven : Une plateforme de base de connaissances agnostique en modèles, construite avec Claude Code
Tools

Knowledge Raven : Une plateforme de base de connaissances agnostique en modèles, construite avec Claude Code

Knowledge Raven est une plateforme de base de connaissances qui permet à tout LLM compatible MCP de rechercher et citer des documents d'entreprise. L'ensemble de la plateforme a été construit avec Claude Code par un fondateur solo, avec un backend Python/FastAPI, une couche d'outils MCP et un pipeline RAG agentique.

OpenClawRadar
Intégration OpenClaw pour les marchés boursiers indiens : Terminal d'analyse multi-agent et de trading
Tools

Intégration OpenClaw pour les marchés boursiers indiens : Terminal d'analyse multi-agent et de trading

Un terminal de trading open source pour les marchés indiens a été connecté en tant que serveur de compétences OpenClaw, permettant à tout agent OpenClaw d'extraire les données du marché boursier indien et d'exécuter une analyse complète via HTTP sans installation locale. Le système utilise sept agents spécialisés travaillant en parallèle pour générer une analyse structurée avec des plans de trading.

OpenClawRadar