Interfaz de chatbot de una sola página para ejecutar localmente Gemma 4 26B A4B

✍️ OpenClawRadar📅 Publicado: 21 de abril de 2026🔗 Source
Interfaz de chatbot de una sola página para ejecutar localmente Gemma 4 26B A4B
Ad

Un desarrollador ha creado una interfaz de chatbot de una sola página HTML diseñada para funcionar con Gemma 4 26B A4B ejecutándose localmente. La implementación se conecta a la API de LM Studio y proporciona una interfaz de chatbot completa en un solo archivo HTML.

Implementación Técnica

El sistema ejecuta Gemma 4 26B A4B localmente con una ventana de contexto de 32K, logrando 50-65 tokens por segundo. El modelo está distribuido entre dos GPUs: una 7900 XT y una 3060 Ti.

Características de la Interfaz

  • Soporte completo de transmisión para respuestas en tiempo real
  • Renderizado de Markdown para salida formateada
  • Selector de modelos para cambiar entre modelos disponibles
  • Seis controles deslizantes de parámetros para ajustar el comportamiento del modelo
  • Edición de mensajes con capacidades de bifurcación del historial
  • Función de regenerar para regenerar respuestas
  • Botón de abortar para detener la generación durante la transmisión
  • Soporte de instrucciones personalizadas mediante prompts del sistema
Ad

Detalles de Desarrollo

El desarrollador señala que se utilizó Claude para corregir dos errores del DOM que Gemma no pudo resolver. Todo el resto del trabajo de desarrollo se completó utilizando Gemma 4. El proyecto está disponible en GitHub para su examen y uso.

Este tipo de interfaz de una sola página es particularmente útil para desarrolladores que trabajan con LLMs locales y desean una interfaz de chat liviana y personalizable sin la complejidad de aplicaciones web complejas. La integración con la API de LM Studio la hace compatible con varios modelos locales más allá de solo Gemma.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Torrix: Observabilidad de LLM autoalojada sin Postgres ni Redis
Herramientas

Torrix: Observabilidad de LLM autoalojada sin Postgres ni Redis

Torrix es una herramienta de observabilidad para LLM autoalojada que se ejecuta como un solo contenedor Docker respaldado por SQLite. Instálala con docker compose up; registra llamadas a LLM a través de proxy HTTP o SDK: tokens, costo, latencia, trazas completas, enmascaramiento de PII, previsión de costos.

OpenClawRadar
Solución Alternativa para la Brecha de Migración de Proyectos de ChatGPT: Exportar Scripts y Prompts
Herramientas

Solución Alternativa para la Brecha de Migración de Proyectos de ChatGPT: Exportar Scripts y Prompts

Un desarrollador creó scripts de Python y prompts de Claude para migrar conversaciones de ChatGPT a Claude cuando la exportación de datos de ChatGPT carece de información de membresía de proyectos. La solución extrae conversaciones utilizando títulos capturados desde la interfaz.

OpenClawRadar
Claude Ops: Panel de navegación para el estado en vivo y seguimiento de subagentes de Claude Code
Herramientas

Claude Ops: Panel de navegación para el estado en vivo y seguimiento de subagentes de Claude Code

Un panel de navegador local y gratuito para macOS que rastrea el estado en vivo de las sesiones de Claude Code, la herramienta actual, los subagentes generados y envía notificaciones push del sistema cuando se necesita entrada.

OpenClawRadar
Chapper: Cliente nativo de iOS para LM Studio, Ollama y modelos locales compatibles con OpenAI
Herramientas

Chapper: Cliente nativo de iOS para LM Studio, Ollama y modelos locales compatibles con OpenAI

Chapper es una aplicación nativa de SwiftUI para iOS que se conecta a LM Studio, Ollama y modelos locales compatibles con OpenAI sin servicios en la nube ni cuentas. Ofrece transmisión de tokens en tiempo real, controles completos de muestreo, soporte para modelos de razonamiento con etiquetas <think> y exportación en 7 formatos.

OpenClawRadar