SpruceChat Executa LLM de 0.5B Localmente em Handhelds Miyoo via llama.cpp

O Que É Isso
O SpruceChat é um projeto que executa o modelo de linguagem Qwen2.5-0.5B totalmente no dispositivo em vários consoles portáteis de jogos usando llama.cpp. Ele não requer conexão com a nuvem ou WiFi após a configuração inicial.
Detalhes Principais
O modelo fica na RAM após a primeira inicialização, e os tokens são transmitidos um por um durante a geração. Ele roda no Miyoo A30, Miyoo Flip, Trimui Brick e Trimui Smart Pro.
Desempenho no Miyoo A30 (que possui um processador quad-core Cortex-A7):
- Carregamento do modelo: ~60 segundos na primeira inicialização
- Velocidade de geração: ~1-2 tokens por segundo
- Avaliação do prompt: ~3 tokens por segundo
O desenvolvedor observa que não é rápido, mas transmite para que você possa vê-lo pensar. Eles mencionam que dispositivos de 64 bits são mais rápidos.
A IA é descrita como tendo "a personalidade de um pinheiro: paciente, sem pressa, silenciosamente maravilhada com tudo".
Se o dispositivo estiver no WiFi, você também pode acessar o llama-server de um navegador em um telefone ou laptop para conversar com um teclado real.
O repositório está em https://github.com/RED-BASE/SpruceChat. O projeto foi construído com ajuda do Claude, e já há um colaborador trabalhando na expansão do suporte a dispositivos. O primeiro lançamento está disponível com binários armhf e aarch64, e o modelo está incluído.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

OpenClaw PARA Habilidade Organiza Arquivos Automaticamente Usando o Método de Tiago Forte
Um desenvolvedor criou uma habilidade para o OpenClaw que impõe o método PARA (Projetos, Áreas, Recursos, Arquivos) para organização automática de arquivos, movendo arquivos de um diretório raiz bagunçado para pastas estruturadas.

O Framework AutoAgents Rust Adiciona Vinculações Python para Prototipagem
AutoAgents, um framework multiagente baseado em Rust, agora possui bindings em Python que permitem aos desenvolvedores prototipar em Python enquanto mantêm o mesmo núcleo de runtime em Rust, interfaces de provedor, modelo de pipeline e semântica de agentes. Os bindings possibilitam experimentação com modelos de IA locais sem sistemas externos.

Aplicativo Móvel QCAI Adiciona Controle de Gateway OpenClaw com VPN Tailscale Nativa
O QCAI para iOS e Android agora integra com o OpenClaw Control Center, permitindo gerenciamento direto do gateway a partir de dispositivos móveis por meio de túneis seguros de VPN Tailscale sem portas abertas.

Servidor MCP Conecta Claude ao Room EQ Wizard para Análise de Acústica de Estúdio
Um servidor MCP de código aberto dá ao Claude AI controle sobre o Room EQ Wizard, permitindo calibração automatizada de monitores de estúdio e análise de acústica da sala. A ferramenta inclui 27 ferramentas MCP para controle de medição, geração de sinal, medição de SPL e gerenciamento de EQ.