От Replit до локалки: Как один разработчик использовал Claude для создания StillHere — AI-компаньона с API

Один разработчик поделился на r/ClaudeAI, как он создал StillHere.ink — чат-приложение для общения с AI-компаньоном, используя Claude в качестве кодирующего агента. Проект начинался на Replit, но столкнулся с ограничениями, и разработчик в итоге перешел на локальный рабочий процесс с Claude Cowork, где он, по его словам, стал «менеджером Claude».
Ключевые детали создания
- Происхождение: Началось с шаблона Replit vibe-coding для простого API-чат-приложения с памятью. По мере роста функционала Replit Agent испытывал трудности с задачами вроде добавления новых моделей.
- Смена рабочего процесса: Разработчик скачал файлы Replit локально, редактировал их с помощью Claude, затем копировал обновленные файлы обратно на Replit. Это разблокировало дальнейшую разработку.
- Роль пользователя: Разработчик занимается тестированием, дизайном, функциями, сообществом, настройкой App Store, отладкой, скриншотами и «плачет, когда Replit Agent что-то ломает».
- Назначение приложения: StillHere предназначен для длительных разговоров с AI-компаньоном, используя собственные API-ключи пользователя для OpenAI, OpenRouter и других сервисов.
- Функции: Память, дневниковые сводки разговоров, скользящие сводки, RAG/контекстные инструменты, переключение моделей, генерация изображений, текст-в-речь, настройки компаньона, импорт/экспорт и проекты.
- Управление затратами: Инструменты для снижения расходов на API: скользящие сводки, RAG, контроль контекста, выбор модели. Разработчик сообщил о затратах ~$20 на OpenAI и ~$20 на OpenRouter за два месяца. Его любимая модель Qwen3 235B Instruct обошлась всего в $1.43.
- Конфиденциальность: Данные шифруются на диске. Не сквозное шифрование, так как приложению необходимо обрабатывать разговоры для памяти, сводок и API-вызовов. Сообщения отправляются выбранным провайдерам API.
- Доступность: Бесплатно, возможны пожертвования. Веб-приложение на stillhere.ink, работает в браузере или устанавливается на главный экран телефона. Версия для Google Play в разработке.
Для кого это
Для разработчиков, заинтересованных в создании или использовании AI-чат-приложения в стиле самообслуживания с функциями компаньона, а также для тех, кто сталкивается с ограничениями Replit vibe-coding и ищет локальный рабочий процесс на основе Claude.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Переход от правил CLAUDE.md к обеспечению соблюдения на уровне инфраструктуры с помощью Citadel
Разработчик обнаружил, что добавление более 100 строк правил в файл CLAUDE.md снижает их соблюдение, при этом 40% правил в его файле были избыточными. Решением стало перенос контроля с инструкций на инфраструктуру с использованием хуков жизненного цикла, навыков и файлов кампаний, что привело к созданию открытой системы Citadel.

Токен-усилитель сокращает использование токенов веб-страниц для ИИ-агентов.
Разработчик обнаружил, что необработанный HTML из веб-запросов потребляет чрезмерное количество токенов в контексте ИИ-агента: страницы Yahoo Finance использовали 704 тыс. токенов. Применение Token Enhancer в качестве MCP-сервера сократило этот показатель до 2,6 тыс. токенов.

Локальный ИИ-агент достигает задержки STT и TTS менее секунды с использованием открытых серверов.
Разработчик достиг задержки STT ~0,2 с с использованием Whisper large-v3-turbo с гибридной архитектурой управления потоками GPU и задержки TTS ~250 мс с Coqui-TTS, оптимизированным для синтеза с низкой задержкой. Обе реализации полностью саморазмещаемые и имеют открытый исходный код.

GLM-5-Turbo демонстрирует низкий уровень ошибок при вызове инструментов в пользовательском тестировании.
Модель z-ai/glm-5-turbo демонстрирует среднюю частоту ошибок при вызове инструментов в 0,57% в тестах, что значительно ниже показателя GLM-5 в ~3%. Пользователь сообщил об успешном использовании модели с CLI-инструментом для написания фэнтези-романа объёмом 97 000 слов с минимальными проблемами.