Chapper: Native iOS-Client für LM Studio, Ollama und OpenAI-kompatible lokale Modelle

✍️ OpenClawRadar📅 Veröffentlicht: 20. April 2026🔗 Source
Chapper: Native iOS-Client für LM Studio, Ollama und OpenAI-kompatible lokale Modelle
Ad

Chapper ist ein nativer SwiftUI iOS-Client zur Verbindung mit lokalen KI-Modellen, die auf LM Studio, Ollama und jedem OpenAI-kompatiblen Server laufen. Die App läuft vollständig auf dem Gerät ohne Cloud-Anforderungen, Web-Views oder verpflichtende Konten.

Kernfunktionen

  • Echtzeit-Token-Streaming mit Live-Inferenzgeschwindigkeitsanzeige
  • Vollständige Sampling-Kontrollen: Temperatur, Top-p, Top-k, Min-p, TFS-Z, Wiederholungs-/Präsenz-/Frequenz-Strafe
  • Strukturierte Ausgabe/JSON-Schema-Modus
  • Markdown-Rendering mit syntaxhervorgehobenen Codeblöcken

Unterstützung für Reasoning-Modelle

  • Einklappbarer Denkprozessbereich direkt über jeder Antwort
  • Funktioniert mit Qwen3, DeepSeek-R1 und jedem Modell, das <think>-Tags verwendet
  • Benutzerdefinierter <think>-Tag-Parser für Reasoning-Modellausgaben

Modellverwaltung

  • In-App-Modellverwaltung: Durchsuchen, Laden, Kontextlänge konfigurieren
  • Flash-Attention-Unterstützung
  • GPU-KV-Cache-Offload

Konversationsfunktionen

  • Personas mit persistenten System-Prompts pro Chat
  • Volltextsuche über alle Konversationen + angeheftete Chats
  • Speichersystem, das langfristigen Kontext automatisch einfügt
  • Notizblock für Arbeitsnotizen während des Chattens
Ad

Ausgabeoptionen

  • Export in 7 Formaten: PDF, HTML, Markdown, JSON, CSV, XML, TXT
  • TTS in drei Modi: native iOS-Stimmen, lokales On-Device-Kokoro-Modell (experimentell) oder benutzerdefinierter TTS-Server
  • Unterstützung für Hintergrundwiedergabe

Technische Umsetzung

  • Natives asynchrones Streaming über SSE
  • MCP-Tool-Integration für Websuche, Dateizugriff, URL-Abruf
  • iCloud-Sync (optional)
  • On-Device-Analytics-Dashboard
  • Unterstützung für 12 Sprachen
  • Benutzerdefinierte Haptik mit Umschaltoption

Preise & Verfügbarkeit

Kostenlos + Pro-Modell mit Einmalkauf, kein Abonnement. Kern-Chat ist kostenlos. Pro schaltet erweiterte Sampling-Funktionen, unbegrenzten Verlauf, alle Exportformate, benutzerdefinierte Icons und unbegrenzte Personas frei. Funktioniert auf iPhone und iPad.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

NERF Open-Source-KI-Sicherheits-Engineering-Plattform tritt in die öffentliche Beta-Phase ein
Werkzeuge

NERF Open-Source-KI-Sicherheits-Engineering-Plattform tritt in die öffentliche Beta-Phase ein

NERF ist eine Open-Source-Plattform für KI-Sicherheitsentwicklung und ein autonomer Coding-Agent, der offensive, defensive und Datenschutz-Sicherheitstechniken über 117 Domänen abdeckt. Es bietet 9 automatisch erkannte Betriebsmodi, Unterstützung für 26 LLM-Anbieter und Compliance-Automatisierung für 39 Frameworks.

OpenClawRadar
Datenschutzorientiertes MCP-Server-Verzeichnis startet mit dokumentierten Datenverarbeitungsrichtlinien
Werkzeuge

Datenschutzorientiertes MCP-Server-Verzeichnis startet mit dokumentierten Datenverarbeitungsrichtlinien

Ein neues Verzeichnis unter toolora.dev/mcp-hub listet MCP-Server mit dokumentierten Datenverarbeitungsrichtlinien auf, einschließlich der Klassifizierung lokal vs. gehostet, welche Daten jedes Tool überträgt und ob Konten erforderlich sind. Der Ersteller bietet auch eine Browser-Testmethode an, um Datenschutzbehauptungen zu überprüfen.

OpenClawRadar
Claude Code Routines: Automatisierte Cloud-Aufgaben für KI-Entwicklungsworkflows
Werkzeuge

Claude Code Routines: Automatisierte Cloud-Aufgaben für KI-Entwicklungsworkflows

Claude Code Routines ermöglichen es Entwicklern, Claude Code-Konfigurationen als automatisierte Aufgaben zu speichern, die auf der von Anthropic verwalteten Cloud-Infrastruktur ausgeführt werden. Routines unterstützen geplante, API- und GitHub-Trigger für die unbeaufsichtigte Ausführung von Prompts gegen Repositories.

OpenClawRadar
RTX 5060 Ti 16GB Lokale LLM-Benchmarks: 30B-Modelle liegen beim Programmieren immer noch vorn
Werkzeuge

RTX 5060 Ti 16GB Lokale LLM-Benchmarks: 30B-Modelle liegen beim Programmieren immer noch vorn

Benchmarks auf einer RTX 5060 Ti 16GB zeigen, dass Unsloth Qwen3-Coder-30B UD-Q3_K_XL unter Ubuntu 76,3 Tok/s bei einer Qualitätsbewertung von 8,14 erreicht, was es zum empfohlenen Standard-Codemodell macht. Das Unsloth Qwen3.5-35B UD-Q2_K_XL erreicht 80,1 Tok/s, jedoch mit niedrigeren Qualitätsbewertungen.

OpenClawRadar