Chapper: Native iOS-Client für LM Studio, Ollama und OpenAI-kompatible lokale Modelle

Chapper ist ein nativer SwiftUI iOS-Client zur Verbindung mit lokalen KI-Modellen, die auf LM Studio, Ollama und jedem OpenAI-kompatiblen Server laufen. Die App läuft vollständig auf dem Gerät ohne Cloud-Anforderungen, Web-Views oder verpflichtende Konten.
Kernfunktionen
- Echtzeit-Token-Streaming mit Live-Inferenzgeschwindigkeitsanzeige
- Vollständige Sampling-Kontrollen: Temperatur, Top-p, Top-k, Min-p, TFS-Z, Wiederholungs-/Präsenz-/Frequenz-Strafe
- Strukturierte Ausgabe/JSON-Schema-Modus
- Markdown-Rendering mit syntaxhervorgehobenen Codeblöcken
Unterstützung für Reasoning-Modelle
- Einklappbarer Denkprozessbereich direkt über jeder Antwort
- Funktioniert mit Qwen3, DeepSeek-R1 und jedem Modell, das <think>-Tags verwendet
- Benutzerdefinierter <think>-Tag-Parser für Reasoning-Modellausgaben
Modellverwaltung
- In-App-Modellverwaltung: Durchsuchen, Laden, Kontextlänge konfigurieren
- Flash-Attention-Unterstützung
- GPU-KV-Cache-Offload
Konversationsfunktionen
- Personas mit persistenten System-Prompts pro Chat
- Volltextsuche über alle Konversationen + angeheftete Chats
- Speichersystem, das langfristigen Kontext automatisch einfügt
- Notizblock für Arbeitsnotizen während des Chattens
Ausgabeoptionen
- Export in 7 Formaten: PDF, HTML, Markdown, JSON, CSV, XML, TXT
- TTS in drei Modi: native iOS-Stimmen, lokales On-Device-Kokoro-Modell (experimentell) oder benutzerdefinierter TTS-Server
- Unterstützung für Hintergrundwiedergabe
Technische Umsetzung
- Natives asynchrones Streaming über SSE
- MCP-Tool-Integration für Websuche, Dateizugriff, URL-Abruf
- iCloud-Sync (optional)
- On-Device-Analytics-Dashboard
- Unterstützung für 12 Sprachen
- Benutzerdefinierte Haptik mit Umschaltoption
Preise & Verfügbarkeit
Kostenlos + Pro-Modell mit Einmalkauf, kein Abonnement. Kern-Chat ist kostenlos. Pro schaltet erweiterte Sampling-Funktionen, unbegrenzten Verlauf, alle Exportformate, benutzerdefinierte Icons und unbegrenzte Personas frei. Funktioniert auf iPhone und iPad.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

NERF Open-Source-KI-Sicherheits-Engineering-Plattform tritt in die öffentliche Beta-Phase ein
NERF ist eine Open-Source-Plattform für KI-Sicherheitsentwicklung und ein autonomer Coding-Agent, der offensive, defensive und Datenschutz-Sicherheitstechniken über 117 Domänen abdeckt. Es bietet 9 automatisch erkannte Betriebsmodi, Unterstützung für 26 LLM-Anbieter und Compliance-Automatisierung für 39 Frameworks.

Datenschutzorientiertes MCP-Server-Verzeichnis startet mit dokumentierten Datenverarbeitungsrichtlinien
Ein neues Verzeichnis unter toolora.dev/mcp-hub listet MCP-Server mit dokumentierten Datenverarbeitungsrichtlinien auf, einschließlich der Klassifizierung lokal vs. gehostet, welche Daten jedes Tool überträgt und ob Konten erforderlich sind. Der Ersteller bietet auch eine Browser-Testmethode an, um Datenschutzbehauptungen zu überprüfen.

Claude Code Routines: Automatisierte Cloud-Aufgaben für KI-Entwicklungsworkflows
Claude Code Routines ermöglichen es Entwicklern, Claude Code-Konfigurationen als automatisierte Aufgaben zu speichern, die auf der von Anthropic verwalteten Cloud-Infrastruktur ausgeführt werden. Routines unterstützen geplante, API- und GitHub-Trigger für die unbeaufsichtigte Ausführung von Prompts gegen Repositories.

RTX 5060 Ti 16GB Lokale LLM-Benchmarks: 30B-Modelle liegen beim Programmieren immer noch vorn
Benchmarks auf einer RTX 5060 Ti 16GB zeigen, dass Unsloth Qwen3-Coder-30B UD-Q3_K_XL unter Ubuntu 76,3 Tok/s bei einer Qualitätsbewertung von 8,14 erreicht, was es zum empfohlenen Standard-Codemodell macht. Das Unsloth Qwen3.5-35B UD-Q2_K_XL erreicht 80,1 Tok/s, jedoch mit niedrigeren Qualitätsbewertungen.