Чеппер: Нативный клиент для iOS для LM Studio, Ollama и локальных моделей, совместимых с OpenAI

Chapper — это нативный клиент для iOS на SwiftUI, предназначенный для подключения к локальным моделям ИИ, работающим в LM Studio, Ollama и на любом совместимом с OpenAI сервере. Приложение полностью работает на устройстве без необходимости облачных сервисов, веб-представлений или обязательных аккаунтов.
Основные возможности
- Потоковая передача токенов в реальном времени с отображением скорости вывода
- Полный контроль семплирования: температура, top-p, top-k, min-p, TFS-Z, штрафы за повторение/присутствие/частоту
- Режим структурированного вывода/JSON-схемы
- Рендеринг Markdown с подсветкой синтаксиса в блоках кода
Поддержка моделей с рассуждениями
- Сворачиваемая панель процесса мышления встроена над каждым ответом
- Работает с Qwen3, DeepSeek-R1 и любыми моделями, использующими теги <think>
- Пользовательский парсер тегов <think> для вывода моделей с рассуждениями
Управление моделями
- Управление моделями в приложении: просмотр, загрузка, настройка длины контекста
- Поддержка flash attention
- Выгрузка KV-кэша на GPU
Функции диалогов
- Персонажи с постоянными системными промптами для каждого чата
- Полнотекстовый поиск по всем диалогам + закреплённые чаты
- Система памяти, автоматически внедряющая долгосрочный контекст
- Черновик для рабочих заметок во время общения
Варианты вывода
- Экспорт в 7 форматах: PDF, HTML, Markdown, JSON, CSV, XML, TXT
- Преобразование текста в речь в трёх режимах: родные голоса iOS, локальная модель Kokoro на устройстве (экспериментальная) или пользовательский TTS-сервер
- Поддержка воспроизведения в фоновом режиме
Техническая реализация
- Нативная асинхронная потоковая передача через SSE
- Интеграция инструментов MCP для веб-поиска, доступа к файлам, получения URL
- Синхронизация с iCloud (опционально)
- Панель аналитики на устройстве
- Поддержка 12 языков
- Пользовательские тактильные отклики с возможностью отключения
Цены и доступность
Бесплатная + Pro-версия с единоразовой покупкой, без подписки. Основной чат бесплатный. Pro разблокирует расширенное семплирование, неограниченную историю, все форматы экспорта, пользовательские иконки и неограниченное количество персонажей. Работает на iPhone и iPad.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Плагин Claude-ETA добавляет тайминг задач и обнаружение циклов исправлений в Claude Code.
Claude-ETA — это плагин для Claude Code, который отслеживает время выполнения задач, изучает вашу реальную скорость работы и передает актуальные данные обратно в Claude перед ответом. Он также обнаруживает циклы исправления ошибок, анализируя их содержание, и вмешивается после трех одинаковых неудач.

Метод эволюции кода утраивает производительность LLM на тесте ARC-AGI-2
Исследователи достигли улучшения в 2,8 раза на бенчмарке ARC-AGI-2, используя эволюцию кода с открытыми весами моделей, достигнув точности 34% при стоимости $2,67 за задачу. Тот же метод позволил повысить точность Gemini 3.1 Pro до 95% при стоимости $8,71 за задачу.

Создание самообновляющегося руководства по стилю письма для контента с использованием ИИ
Команда, создающая платформу для извлечения голоса Noren, разработала руководство по стилю в формате Markdown на 117 строк, которое переписывается после каждой опубликованной статьи, используя Claude для соблюдения правил и запрещая слова, звучащие как ИИ, такие как 'cadence' и 'optimize'.

Плагин MCP с кэшированием промптов автоматически снижает затраты на API Claude, выявляя стабильный контекст.
Плагин prompt-caching для MCP автоматически определяет стабильные части контекста, такие как системные промпты и определения инструментов, затем помечает их для функции кэширования Anthropic, чтобы снизить стоимость API на 80-92% во время сессий программирования.