SpruceChat ejecuta un modelo de lenguaje de 0.5B en el dispositivo en las consolas portátiles Miyoo mediante llama.cpp.

✍️ OpenClawRadar📅 Publicado: 13 de abril de 2026🔗 Source
SpruceChat ejecuta un modelo de lenguaje de 0.5B en el dispositivo en las consolas portátiles Miyoo mediante llama.cpp.
Ad

Qué es esto

SpruceChat es un proyecto que ejecuta el modelo de lenguaje Qwen2.5-0.5B completamente en el dispositivo en varias consolas de juegos portátiles usando llama.cpp. No requiere conexión a la nube ni WiFi después de la configuración inicial.

Ad

Detalles clave

El modelo reside en la RAM después del primer arranque, y los tokens se transmiten uno por uno durante la generación. Funciona en el Miyoo A30, Miyoo Flip, Trimui Brick y Trimui Smart Pro.

Rendimiento en el Miyoo A30 (que tiene un procesador Cortex-A7 de cuatro núcleos):

  • Carga del modelo: ~60 segundos en el primer arranque
  • Velocidad de generación: ~1-2 tokens por segundo
  • Evaluación de la entrada: ~3 tokens por segundo

El desarrollador señala que no es rápido, pero transmite para que puedas verlo pensar. Mencionan que los dispositivos de 64 bits son más rápidos.

La IA se describe como que tiene "la personalidad de un abeto: paciente, sin prisa, silenciosamente asombrada por todo".

Si el dispositivo está en WiFi, también puedes acceder al servidor llama desde un navegador en un teléfono o portátil para chatear con un teclado real.

El repositorio está en https://github.com/RED-BASE/SpruceChat. El proyecto se construyó con ayuda de Claude, y ya hay un colaborador trabajando en expandir el soporte de dispositivos. La primera versión está disponible con binarios tanto armhf como aarch64, y el modelo está incluido.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Pruebas de referencia de tonterías: resistencia de LLM a indicaciones sin sentido
Herramientas

Pruebas de referencia de tonterías: resistencia de LLM a indicaciones sin sentido

El Bullshit Benchmark evalúa si los modelos de IA identifican y rechazan indicaciones obviamente absurdas en lugar de generar respuestas incorrectas con confianza. Los resultados muestran que los modelos Claude tienen un rendimiento significativamente mejor que los modelos Gemini en la detección de preguntas sin sentido.

OpenClawRadar
Habilidad OpenClaw para Transcripción de Reuniones Locales con Whisper
Herramientas

Habilidad OpenClaw para Transcripción de Reuniones Locales con Whisper

Una nueva habilidad de OpenClaw llamada ghostmeet proporciona transcripción local de reuniones usando Whisper. Captura audio de pestañas del navegador mediante una extensión de Chrome y puede generar resúmenes usando Claude, procesando todo el audio y la transcripción localmente en tu máquina.

OpenClawRadar
Comparación de 14 Variantes del Agente de IA Claw en 10 Categorías
Herramientas

Comparación de 14 Variantes del Agente de IA Claw en 10 Categorías

Una comparación detallada de 14 variantes populares de agentes de IA Claw, incluyendo OpenClaw, NanoClaw, NemoClaw, ZeroClaw, PicoClaw, Moltis, IronClaw y NullClaw, evaluadas a través de 53 subparámetros con clasificaciones compuestas y casos de uso ideales para cada una.

OpenClawRadar
Deblank: Herramienta para Eliminar el Formato de Código y Reducir Tokens en LLM
Herramientas

Deblank: Herramienta para Eliminar el Formato de Código y Reducir Tokens en LLM

Deblank es una herramienta de código abierto que elimina el formato del código (sangría, espacios en blanco, saltos de línea) antes de enviarlo a LLMs, reduciendo tokens en aproximadamente un 30% para Java/C++ y un 9% para Python con una latencia de ~76ms. Es compatible con Python, Java, C/C++, C#, JS/TS y Go.

OpenClawRadar