Gemma4 26B-A4B Ofrece un Rendimiento Local Rápido con Búsqueda Web y Soporte de Imágenes

✍️ OpenClawRadar📅 Publicado: 14 de abril de 2026🔗 Source
Gemma4 26B-A4B Ofrece un Rendimiento Local Rápido con Búsqueda Web y Soporte de Imágenes
Ad

Rendimiento y Características de Gemma4 26B-A4B

El modelo gemma-4-26B-A4B demuestra un rendimiento sólido para uso local, con la fuente reportando velocidades de aproximadamente 145 tokens por segundo cuando se ejecuta en una GPU RTX 4090. Esta combinación de capacidad y velocidad lo hace adecuado para aplicaciones locales responsivas.

Ad

Características Clave de la Fuente

  • Modelo: gemma-4-26B-A4B
  • Rendimiento: ~145 t/s (tokens por segundo) en RTX 4090
  • Integración: Soporte MCP (Protocolo de Contexto del Modelo) para búsqueda web
  • Multimodal: Incluye soporte para imágenes
  • Plataformas: Configuración documentada para uso en Mac e iPhone

La fuente menciona que la experiencia puede mejorarse con trucos simples y un breve mensaje del sistema, aunque no se proporcionan detalles específicos sobre estas optimizaciones en el extracto. El autor ha documentado su proceso de configuración completo en una publicación de blog que cubre la configuración y el uso en múltiples dispositivos.

Para desarrolladores interesados en implementar esta configuración, los detalles completos de configuración, mensajes del sistema y técnicas de optimización están disponibles en la publicación de blog referenciada en la URL proporcionada.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA
Herramientas

Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA

Culpa es una herramienta de código abierto que registra sesiones de agentes LLM con contexto de ejecución completo, permitiendo reproducción determinista utilizando respuestas grabadas como stubs en lugar de acceder a APIs reales. Funciona con las APIs de Anthropic y OpenAI mediante modo proxy o SDK de Python.

OpenClawRadar
Lista seleccionada de más de 260 agentes y herramientas de IA con enfoque en código abierto y autohospedaje.
Herramientas

Lista seleccionada de más de 260 agentes y herramientas de IA con enfoque en código abierto y autohospedaje.

Un repositorio completo de GitHub enumera más de 260 agentes y marcos de IA, haciendo hincapié en opciones de código abierto, autoalojadas y locales, incluyendo Ollama, OpenClaw y DeerFlow.

OpenClawRadar
Analista de Datos Crea Herramienta de Calibración de Prompts con Claude, Sin Experiencia Previa en Frontend
Herramientas

Analista de Datos Crea Herramienta de Calibración de Prompts con Claude, Sin Experiencia Previa en Frontend

Un analista de datos sin experiencia en HTML, CSS o JavaScript creó Prompt Calibrator, una herramienta web del lado del cliente que estructura prompts de IA a través de un formulario con cuatro campos y cuatro modos. La herramienta fue desarrollada usando Claude como socio de revisión de código y está alojada en GitHub Pages.

OpenClawRadar
BotCost.dev: Analizador gratuito para ver cuánto cuestan los bots de IA en tu sitio
Herramientas

BotCost.dev: Analizador gratuito para ver cuánto cuestan los bots de IA en tu sitio

BotCost.dev es una herramienta gratuita que analiza los registros de tu servidor contra 18 huellas digitales conocidas de bots de IA (GPTBot, ClaudeBot, Perplexity, etc.) y estima el costo mensual de ancho de banda — sin necesidad de subir archivos, funciona en el navegador.

OpenClawRadar