OpenClaw Alexa Voice Proxy обеспечивает двустороннее голосовое взаимодействие.

openclaw-alexa-voice — это прокси-сервер на Node.js, который соединяет пользовательский навык Alexa с шлюзом OpenClaw, обеспечивая голосовое взаимодействие с полным доступом к таким инструментам, как электронная почта, календарь и финансы. Система реализует трёхуровневую архитектуру ответов для эффективной обработки различных типов запросов.
Трёхуровневая система ответов
Прокси-сервер классифицирует ответы на три пути в зависимости от сложности и времени обработки:
- Быстрый путь (<1с) — Обрабатывает простые запросы, такие как время, дата и пользовательские API
- Путь агента (<12с) — Предоставляет быстрые ответы из памяти ИИ
- Отложенный путь (<2мин) — Обрабатывает сложные запросы асинхронно, а затем воспроизводит ответ через TTS Home Assistant на любом динамике
Как это работает
Когда запрос требует доступа к инструментам (электронная почта, веб-поиск, рыночные данные), Alexa отвечает «Дайте мне проверить» и завершает сеанс. Затем прокси-сервер отправляет запрос в основную сессию OpenClaw с полным доступом к инструментам, ждёт до 2 минут, удаляет форматирование Markdown и воспроизводит ответ на любом устройстве Echo или Sonos через интеграцию Alexa Media Player в Home Assistant.
Ключевые особенности
- Голосовая аутентификация по PIN-коду с сеансами продолжительностью 1 час
- Маршрутизация TTS на несколько динамиков: любой Echo, Sonos или группа динамиков
- Расширяемая система быстрых ответов для пользовательских API
- Резервный вариант через Telegram в случае сбоя TTS
- Проверка подписи запросов Alexa
- Ограничение частоты запросов и ведение журнала аудита
- Привязка только к localhost в целях безопасности
Технологический стек
Реализация использует Node.js для прокси-сервера, пользовательский навык Alexa для голосового интерфейса, WebSocket шлюза OpenClaw для связи и Home Assistant для воспроизведения TTS. Этот подход позволяет разработчикам расширять голосовые возможности своих экземпляров OpenClaw, сохраняя безопасность за счёт локальной привязки и аутентификации.
Проект был вдохновлён Обсуждением #11154 и доступен как открытый исходный код для разработчиков, которые хотят добавить голосовое взаимодействие в свои настройки OpenClaw. Трёхуровневая система обеспечивает отзывчивое голосовое взаимодействие, позволяя при этом сложным запросам использовать полные возможности инструментов OpenClaw.
📖 Read the full source: r/openclaw
👀 Смотрите также

boxBot: Интеллектуальная колонка с открытым исходным кодом на базе Claude и Hailo AI
Разработчик под ником FunScore645 создал умную колонку boxBot, использующую Claude для агентного управления аппаратным обеспечением, Raspberry Pi, ускоритель ИИ Hailo и собственный SDK — проект с открытым исходным кодом на GitHub.

ProofShot: CLI для AI-агентов для проверки UI-кода с записью в браузере
ProofShot — это инструмент командной строки, который позволяет ИИ-агентам для программирования открывать браузер, взаимодействовать со страницами, записывать сессии и собирать ошибки, а затем упаковывает всё в автономный HTML-файл для проверки. Он работает с любым ИИ-агентом через команды оболочки и поставляется в виде навыка.

Три репозитория для разработки RAG и AI-агентов
В посте на Reddit выделены три репозитория для разработчиков, работающих с RAG и AI-агентами: memvid для памяти агентов, llama_index для RAG-пайплайнов и Continue для ассистентов программирования. Автор отмечает, что чистый RAG лучше всего подходит для извлечения знаний, в то время как системы памяти лучше для агентов, а гибридные подходы часто используются в реальных инструментах.

VibeSmith: Локальный инструмент для выявления конфликтов навыков в проектах Claude Code
VibeSmith — это локальное приложение для macOS, которое обеспечивает единый обзор проектов Claude Code, обнаруживает конфликты, когда глобальные и проектные компоненты имеют одинаковые имена, визуализирует зависимости в виде направленных ациклических графов (DAG) и отслеживает использование токенов контекста.