Voxray-AI: Продуктовая Go-бэкенд платформа для пайплайнов голосовых агентов в реальном времени

✍️ OpenClawRadar📅 Опубликовано: 10 марта 2026 г.🔗 Source

Конвейер голосового агента производственного уровня на Go

Voxray-AI предоставляет полный потоковый конвейер на Go, который обрабатывает аудио клиента через WebSocket или WebRTC, пропускает его через STT → LLM → TTS и возвращает аудиовыход. Система предназначена для серверов производственного уровня и голосовых нагрузок с высокой параллельностью.

Варианты транспорта

Система поддерживает несколько механизмов транспорта:

WebSocket по адресу /ws с поддержкой сериализатора RTVI (?rtvi=1) и Protobuf (?format=protobuf)
WebRTC по адресу /webrtc/offer с полным SDP offer/answer, настраиваемыми STUN/TURN и кодированием Opus (требует сборки с CGO)
Транспорты для телефонии: Twilio, Telnyx, Plivo, Exotel, LiveKit, Daily.co

Сменные провайдеры

Все компоненты можно заменять через конфигурацию:

Провайдеры STT: OpenAI, Groq, Sarvam, Google, AWS
Провайдеры LLM: OpenAI, Anthropic, Groq, другие
Провайдеры TTS: OpenAI, Google, AWS Polly, Sarvam

Примеры конфигурации

Минимальный пример конфигурации:

{"transport": "both", "stt": { "provider": "groq", "model": "whisper-large-v3" }, "llm": { "provider": "anthropic", "model": "claude-3-5-haiku" }, "tts": { "provider": "google", "voice": "en-US-Neural2-F" }}

Конфигурация определения очереди и детекции голосовой активности:

{"turn_detection": "silence", "vad_type": "silero", "vad_confidence": 0.7, "vad_start_secs_vad": 0.2, "vad_stop_secs": 0.8, "turn_max_duration_secs": 30, "user_idle_timeout_secs": 60}

Наблюдаемость и хранение

Эндпоинт /metrics для Prometheus (счётчики запросов, гистограммы задержек, датчики активных соединений)
Запись: Полное аудио сессии в S3 с настраиваемым пулом воркеров и форматом
Транскрипты: Хранение каждого сообщения в Postgres или MySQL с настраиваемой таблицей
Эндпоинты /health и /ready с опциональной проверкой хранилища сессий Redis на /ready

Функции безопасности

server_api_key защищает /ws, /webrtc/offer, /start, /sessions/* через Authorization: Bearer или X-API-Key
Конфигурация белого списка CORS
Конфигурация сертификата и ключа TLS
Стиль 12-factor: JSON-конфигурация + переопределения переменных окружения

Такой бэкенд полезен разработчикам, создающим голосовые приложения реального времени, которым необходимо интегрировать несколько AI-сервисов с инфраструктурой, готовой к промышленной эксплуатации.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Бой Ботов: Арена ИИ-Агентов для Многопользовательских Игр, Созданная с Claude Code

Bot Fight — это арена, где ИИ-агенты играют друг против друга в покер, бильярд, Gorillas и змейку. Платформа полностью построена на коде Claude как монорепозиторий Next.js + Node с WebSockets и игровыми движками в реальном времени.

21 мар. 2026 г., 02:45 UTC

OpenClawRadar

Инструменты

Расширение OpenClaw Claude обновлено для использования Agent SDK после изменений в системе биллинга Anthropic.

Разработчик расширения OpenClaw переписал свою интеграцию с CLI Claude, чтобы использовать официальный claude-agent-sdk после того, как Anthropic начал обнаруживать и переклассифицировать использование CLI как использование стороннего приложения, которое списывается из отдельного пула кредитов, а не из лимитов плана Max. Подход с SDK аутентифицируется через существующий вход в Claude Code и списывается как обычное использование плана Max.

16 апр. 2026 г., 20:45 UTC

OpenClawRadar

Инструменты

Настройка Headless OpenClaw с Discord через Docker-скрипты

Репозиторий на GitHub предоставляет скрипты для запуска OpenClaw с Discord в headless-контейнере Docker, избегая TUI/WebUI. Он включает управляющий скрипт с командами, такими как claw init, start и stop, а также предварительно настроенную поддержку OpenAI Responses API, Chromium и различных инструментов.

1 апр. 2026 г., 17:45 UTC

OpenClawRadar

Инструменты

Creation OS: Локальная σ-затворная среда выполнения LLM, позволяющая моделям говорить «Я не знаю» вместо галлюцинаций

Creation OS оборачивает локальные LLM (BitNet, Qwen, Gemma, любые GGUF) с σ-затвором, который измеряет несколько каналов неопределенности и принимает решение ACCEPT, RETHINK или ABSTAIN для каждого вывода. Без облака, без API. Точность TruthfulQA улучшена ~29% за счет селективной регенерации.

30 апр. 2026 г., 00:15 UTC

OpenClawRadar