Демонстрация голосового вызова агента OpenClaw с потоковым синтезом речи (TTS) и функцией перебивания (Barge-in)

Разработчик продемонстрировал своего агента OpenClaw, совершающего реальные телефонные звонки через Telegram. Агент инициирует голосовые вызовы и ведёт полноценные разговоры при получении команды "call me now".
Детали технической реализации
Демонстрация демонстрирует две конкретные технические особенности:
- Потоковое преобразование текста в речь (TTS): Агент отвечает предложение за предложением вместо ожидания генерации полного ответа. Это снижает задержку и создаёт более естественный поток разговора.
- Поддержка перебивания: Пользователи могут прерывать агента в середине предложения, подобно реальным человеческим телефонным разговорам. Это позволяет более динамичное взаимодействие без необходимости ждать, пока агент закончит говорить.
Реализация использует Telegram в качестве интерфейсной платформы, где команда "call me now" запускает агент для инициации телефонного звонка. После подключения разговор продолжается с включёнными возможностями потокового TTS и перебивания.
Такой тип голосового интерфейса представляет собой переход от традиционных взаимодействий с чат-ботами к более естественной, реальной коммуникации. Потоковый TTS особенно ценен для голосовых приложений, где задержка ответа может нарушить поток разговора. Функциональность перебивания, хотя и распространённая в корпоративных IVR-системах, реже реализуется в контексте ИИ-агентов, но значительно улучшает пользовательский опыт, позволяя естественные прерывания.
📖 Read the full source: r/openclaw
👀 Смотрите также

Клод Код против Кодекса: Разделение рабочего процесса разработчика
Разработчик делится практическим разделением: Claude Code для сфокусированной работы с репозиторием и чистыми diff'ами, Codex для запутанных кросс-инструментальных задач, включающих браузер, документацию и тестирование приложения.

Использование Claude Code для автоматизации экспериментов по исследованию ИИ в течение 12 часов.
Разработчик использовал Claude Code для проведения автоматизированных экспериментов по исследованию ИИ в течение 12 часов, настраивая фреймворк непрерывного обучения для максимизации соответствия модели верификаторам предпочтений. Система провела 9 экспериментов, исправила ошибку коллапса модели и достигла 100% соответствия, начав с 0%.

SkiTomorrow.ai: Движок для принятия решений о горнолыжных поездках, созданный с помощью Claude Code
SkiTomorrow.ai — это бесплатный веб-инструмент, который оценивает 234 горнолыжных курорта по всему миру на основе актуальных прогнозов снега, расстояния до них и стоимости, а затем предоставляет персонализированные рейтинги. Разработчик создал его полностью с помощью Claude Code и поделился конкретными инсайтами о рабочем процессе.

Создание AI-ресепшиониста для автомастерской: RAG-пайплайн и интеграция голосового управления
Разработчик создал пользовательского ИИ-ресепшиониста по имени Axle для люксовой автомастерской, используя RAG-пайплайн с MongoDB Atlas и эмбеддингами Voyage AI, а затем подключил его к реальной телефонной линии через Vapi с использованием FastAPI и Ngrok.