Chapper: Cliente Nativo iOS para LM Studio, Ollama e Modelos Locais Compatíveis com OpenAI

Chapper é um cliente iOS nativo em SwiftUI para conexão com modelos de IA locais executados no LM Studio, Ollama e qualquer servidor compatível com OpenAI. O aplicativo funciona totalmente no dispositivo, sem requisitos de nuvem, visualizações da web ou contas obrigatórias.
Recursos Principais
- Streaming de tokens em tempo real com exibição da velocidade de inferência ao vivo
- Controles completos de amostragem: temperatura, top-p, top-k, min-p, TFS-Z, penalidade de repetição/presença/frequência
- Modo de saída estruturada/esquema JSON
- Renderização Markdown com blocos de código destacados por sintaxe
Suporte a Modelos de Raciocínio
- Painel de processo de pensamento recolhível inline acima de cada resposta
- Funciona com Qwen3, DeepSeek-R1 e qualquer modelo que use tags <think>
- Analisador personalizado de tags <think> para saída de modelos de raciocínio
Gerenciamento de Modelos
- Gerenciamento de modelos no aplicativo: navegar, carregar, configurar comprimento do contexto
- Suporte a atenção flash
- Descarga de cache KV da GPU
Recursos de Conversação
- Personas com prompts de sistema persistentes por chat
- Busca de texto completo em todas as conversas + chats fixados
- Sistema de memória que injeta contexto de longo prazo automaticamente
- Bloco de rascunho para anotações de trabalho durante o chat
Opções de Saída
- Exportação em 7 formatos: PDF, HTML, Markdown, JSON, CSV, XML, TXT
- TTS em três modos: vozes nativas do iOS, modelo Kokoro local no dispositivo (experimental) ou servidor TTS personalizado
- Suporte a reprodução em segundo plano
Implementação Técnica
- Streaming assíncrono nativo sobre SSE
- Integração de ferramentas MCP para busca na web, acesso a arquivos, obtenção de URLs
- Sincronização iCloud (opcional)
- Painel de análise no dispositivo
- Suporte a 12 idiomas
- Háptica personalizada com opção de alternância
Preços e Disponibilidade
Modelo Gratuito + Pro com compra única, sem assinatura. O chat principal é gratuito. O Pro desbloqueia amostragem avançada, histórico ilimitado, todos os formatos de exportação, ícones personalizados e personas ilimitadas. Funciona em iPhone e iPad.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Sentinel: Plataforma de Agentes Auto-Hospedada para Assinantes do Claude Code
Sentinel é uma plataforma de agentes gratuita e de código aberto que roda diretamente no seu token OAuth do Claude Code existente, sem sobrecarga de API. Oferece uma interface de operador limpa com automação de navegador em tempo real via VNC integrado e inclui recursos como controle de Git, logs de rastreamento de sessão e memória hierárquica estruturada.

Descarregue o trabalho rotineiro do Claude Code para Gemma via servidor MCP offload-mcp
offload-mcp é um novo servidor MCP que permite ao Claude delegar tarefas rotineiras, como mensagens de commit e resumos de PR, para APIs de modelos gratuitos (padrão Gemma via API Google GenAI), economizando tokens do Claude e executando trabalhos leves sem restrições de hardware local.

A ferramenta Squeez comprime a saída do bash em mais de 90% para estender a janela de contexto do Claude Code
Squeez é um hook que comprime automaticamente a saída bruta do bash como ps aux, logs do docker e log do git antes de chegar ao Claude Code. Ele reduz o uso de tokens em 92,8% em média em 19 comandos comuns, ajudando as sessões a durarem mais tempo.

A ferramenta de automação de fluxo de trabalho Symphony funciona com o Claude Code
Um desenvolvedor conseguiu fazer a especificação do Symphony funcionar com o Claude Code para automatizar fluxos de trabalho de ticket para PR, usando Node/TypeScript inicialmente, mas observando que Elixir pode ser melhor. A ferramenta requer configuração separada de chave de API e faturamento além das assinaturas do Claude.