Chapper: Native iOS-App für lokale AI-Modelle (LM Studio, Ollama)

Chapper ist ein nativer SwiftUI iOS-Client zur Verbindung mit lokalen KI-Modellen, die auf LM Studio, Ollama und jedem OpenAI-kompatiblen Server laufen. Die App läuft vollständig auf dem Gerät ohne Cloud-Anforderungen, Web-Views oder verpflichtende Konten.

Kernfunktionen

Echtzeit-Token-Streaming mit Live-Inferenzgeschwindigkeitsanzeige
Vollständige Sampling-Kontrollen: Temperatur, Top-p, Top-k, Min-p, TFS-Z, Wiederholungs-/Präsenz-/Frequenz-Strafe
Strukturierte Ausgabe/JSON-Schema-Modus
Markdown-Rendering mit syntaxhervorgehobenen Codeblöcken

Unterstützung für Reasoning-Modelle

Einklappbarer Denkprozessbereich direkt über jeder Antwort
Funktioniert mit Qwen3, DeepSeek-R1 und jedem Modell, das <think>-Tags verwendet
Benutzerdefinierter <think>-Tag-Parser für Reasoning-Modellausgaben

Modellverwaltung

In-App-Modellverwaltung: Durchsuchen, Laden, Kontextlänge konfigurieren
Flash-Attention-Unterstützung
GPU-KV-Cache-Offload

Konversationsfunktionen

Personas mit persistenten System-Prompts pro Chat
Volltextsuche über alle Konversationen + angeheftete Chats
Speichersystem, das langfristigen Kontext automatisch einfügt
Notizblock für Arbeitsnotizen während des Chattens

Ausgabeoptionen

Export in 7 Formaten: PDF, HTML, Markdown, JSON, CSV, XML, TXT
TTS in drei Modi: native iOS-Stimmen, lokales On-Device-Kokoro-Modell (experimentell) oder benutzerdefinierter TTS-Server
Unterstützung für Hintergrundwiedergabe

Technische Umsetzung

Natives asynchrones Streaming über SSE
MCP-Tool-Integration für Websuche, Dateizugriff, URL-Abruf
iCloud-Sync (optional)
On-Device-Analytics-Dashboard
Unterstützung für 12 Sprachen
Benutzerdefinierte Haptik mit Umschaltoption

Preise & Verfügbarkeit

Kostenlos + Pro-Modell mit Einmalkauf, kein Abonnement. Kern-Chat ist kostenlos. Pro schaltet erweiterte Sampling-Funktionen, unbegrenzten Verlauf, alle Exportformate, benutzerdefinierte Icons und unbegrenzte Personas frei. Funktioniert auf iPhone und iPad.

📖 Read the full source: r/LocalLLaMA

Chapper: Native iOS-Client für LM Studio, Ollama und OpenAI-kompatible lokale Modelle

Kernfunktionen

Unterstützung für Reasoning-Modelle

Modellverwaltung

Konversationsfunktionen

Ausgabeoptionen

Technische Umsetzung

Preise & Verfügbarkeit

👀 Siehe auch

Reasoning Guard: Proxy-Level Schleifenerkennung für lokale LLM-Inferenz

nervx: CLI-Tool reduziert Claude Code Token-Verbrauch durch Analyse der Codebasis-Struktur

Lokale Buchübersetzungs-Pipeline nutzt Qwen 32B und Mistral 24B mit kontextuellem RAG

OpenClaw-Fähigkeit fügt KI-Bildgenerierung mit lokaler ComfyUI-Unterstützung und kuratierten Prompts hinzu