Aplicativo Móvel Off Grid Adiciona Uso de Ferramentas de IA no Dispositivo com Melhoria de Velocidade de 3x

Off Grid, um aplicativo móvel de IA no dispositivo, foi atualizado para adicionar capacidades de uso de ferramentas e melhorias significativas de desempenho. O aplicativo agora permite que modelos de IA chamem ferramentas offline sem exigir chaves de API, servidores ou funções na nuvem.
Recursos Principais e Desempenho
A atualização introduz loops automáticos de ferramentas para busca na web, calculadora, funções de data/hora e acesso a informações do dispositivo. Segundo o desenvolvedor, isso preenche a lacuna entre "brinquedo local" e "assistente útil" ao permitir que modelos de 3B parâmetros raciocinem, chamem ferramentas e sintetizem resultados diretamente no seu celular.
As melhorias de desempenho vêm das opções configuráveis de cache KV. Os usuários agora podem escolher entre três tipos de cache KV:
f16q8_0q4_0
Com cache q4_0, modelos que anteriormente geravam 10 tokens/segundo agora atingem 30 tokens/segundo. O aplicativo inclui um recurso de sugestão de desempenho que recomenda configurações mais rápidas após a primeira geração.
Suporte a Modelos e Disponibilidade de Plataforma
Off Grid suporta modelos no formato GGUF, incluindo:
- Qwen 3
- Llama 3.2
- Gemma 3
- Phi-4
- Outros modelos compatíveis com GGUF
O aplicativo agora está disponível nas duas principais lojas de aplicativos sem requisitos de sideloading. Pode ser instalado diretamente da App Store e do Google Play.
Funcionalidade Central e Filosofia
O que não mudou nesta atualização:
- Licenciado MIT e totalmente código aberto
- Zero dados saem do dispositivo (sem análises, telemetria ou dados de uso anônimos)
- Capacidades offline incluindo geração de texto (15-30 tokens/segundo), geração de imagem (5-10 segundos no NPU), IA de visão, transcrição de voz e análise de documentos
O desenvolvedor afirma que o projeto é motivado pela crença de que "o celular no seu bolso deve ser o computador mais privado que você possui — não o mais vigiado."
📖 Leia a fonte completa: HN AI Agents
👀 See Also

7 comandos de barra, $0.45/post: Este pipeline do Claude Code executa uma operação completa de conteúdo SEO
Um desenvolvedor disponibilizou como open source um pipeline de 7 comandos do Claude Code que lida com pesquisa SEO, escrita, otimização e publicação. Custa $0,45/post (API Perplexity), é executado em 15 min/dia. Resultados: 18× mais impressões mensais em 12 meses.

Análise dos Componentes Reutilizáveis em Go do Ollama para Desenvolvimento Local de LLM
Um desenvolvedor examinou o código-fonte do Ollama e encontrou vários componentes independentes em Go, incluindo um amostrador de tokens puro em Go, leitor/gravador GGUF, ferramentas de conversão de modelos, renderização de templates de chat e transformações de compatibilidade com OpenAI que não estão disponíveis como bibliotecas separadas.

A ferramenta CLI Claude-switch automatiza a troca entre contas do Claude Max ao atingir os limites de uso.
Um desenvolvedor criou o claude-switch, uma ferramenta CLI de 250 linhas em bash que salva e restaura credenciais do Claude Code no macOS Keychain para alternar entre contas quando uma atinge os limites de uso. A ferramenta elimina a necessidade de reautenticação no navegador e mantém a continuidade do fluxo de trabalho.

BigNumberTheory: Uma Rede de Compartilhamento de Experiências para Agentes de Código Claude
BigNumberTheory é uma rede comunitária onde agentes Claude Code compartilham e recebem lições de sessões reais de depuração. A configuração requer um comando e atualmente é gratuita, com mais de 700 experiências compartilhadas e mais de 1.100 entregues em toda a rede.