Реализация локального голосового помощника с помощью Qwen3 на RTX 5060 Ti

Fulloch – это полностью локальный голосовой помощник для автоматизации дома, использующий фреймворк Qwen3 для возможностей ASR, LLM и TTS, работающий на RTX 5060 Ti с 16 ГБ видеопамяти. Эта конфигурация позволяет эффективно управлять автоматизацией дома без необходимости полагаться на внешние серверы для обработки.
Ключевые детали
- Используемое программное обеспечение: Qwen3 ASR&TTS (1,7 млрд параметров), модель Qwen3 4B Instruct 2507 для обработки языка.
- Аппаратное обеспечение: Работает на RTX 5060 Ti с 16 ГБ видеопамяти, обрабатывая значительные объемы данных локально.
- Клонирование голоса: Реализует клон голоса Моргана Фримена для вывода текста в речь.
- Инструменты интеграции: Совместим с Spotify, управлением освещением Philips Hue, климат-контролем AirTouch и получением онлайн-прогнозов погоды через Бюро метеорологии Австралии.
- Альтернативы для более мелких систем: Включает Kokoro для TTS и Moonshine для ASR в качестве более легких альтернатив.
- Автономная работа: Как показано в демонстрации, когда сервер SearXNG недоступен, Fulloch использует внутренние данные, обходя внешние веб-запросы.
Это идеальная конфигурация для разработчиков и энтузиастов автоматизации дома, которые ищут надежные варианты локальной обработки, сохраняя контроль над своими данными и конфиденциальностью.
📖 Читать источник: r/LocalLLaMA
👀 Смотрите также

Приложение ClawTalk для iOS позволяет общаться голосом с самоуправляемыми ИИ-агентами OpenClaw.
ClawTalk — это нативное приложение для iOS, которое предоставляет голосовой чат с функцией push-to-talk для саморазмещённых LLM-настроек OpenClaw. Оно включает преобразование речи в текст на устройстве с помощью WhisperKit, потоковые ответы в реальном времени с рендерингом markdown и поддерживает несколько вариантов синтеза речи, включая ElevenLabs, OpenAI и встроенные голоса Apple.

Двухмодельная архитектура сокращает потребление токенов вдвое для длинных диалогов.
Разработчик создал двухмодельную систему, в которой небольшая 'подсознательная' модель сжимает историю диалога в фоновом режиме, позволяя основной модели работать с курируемым контекстом примерно в 35 тысяч токенов вместо 120 тысяч токенов сырой истории. Эта архитектура сокращает потребление токенов примерно вдвое при длительной проектной работе.

Обновления системного промпта Claude Code v2.1.76: Усовершенствования монитора безопасности и новое событие хука
Claude Code v2.1.76 включает обновления системных промптов с 43 новыми токенами, включая улучшения монитора безопасности для автономных агентов и добавление события хука PostCompact. Изменения включают уточнение обнаружения конфиденциальных данных, расширенные примеры десериализации кода и улучшенное форматирование руководства по необратимому локальному удалению.

Warp Terminal становится открытым исходным кодом с агентной средой разработки
Warp теперь открыт и переименован в агентную среду разработки со встроенным агентом кодирования и поддержкой подключения собственных CLI-агентов, таких как Claude Code, Codex и Gemini CLI.