Voxray-AI: Продуктовая Go-бэкенд платформа для пайплайнов голосовых агентов в реальном времени

Конвейер голосового агента производственного уровня на Go
Voxray-AI предоставляет полный потоковый конвейер на Go, который обрабатывает аудио клиента через WebSocket или WebRTC, пропускает его через STT → LLM → TTS и возвращает аудиовыход. Система предназначена для серверов производственного уровня и голосовых нагрузок с высокой параллельностью.
Варианты транспорта
Система поддерживает несколько механизмов транспорта:
- WebSocket по адресу
/wsс поддержкой сериализатора RTVI (?rtvi=1) и Protobuf (?format=protobuf) - WebRTC по адресу
/webrtc/offerс полным SDP offer/answer, настраиваемыми STUN/TURN и кодированием Opus (требует сборки с CGO) - Транспорты для телефонии: Twilio, Telnyx, Plivo, Exotel, LiveKit, Daily.co
Сменные провайдеры
Все компоненты можно заменять через конфигурацию:
- Провайдеры STT: OpenAI, Groq, Sarvam, Google, AWS
- Провайдеры LLM: OpenAI, Anthropic, Groq, другие
- Провайдеры TTS: OpenAI, Google, AWS Polly, Sarvam
Примеры конфигурации
Минимальный пример конфигурации:
{"transport": "both", "stt": { "provider": "groq", "model": "whisper-large-v3" }, "llm": { "provider": "anthropic", "model": "claude-3-5-haiku" }, "tts": { "provider": "google", "voice": "en-US-Neural2-F" }}Конфигурация определения очереди и детекции голосовой активности:
{"turn_detection": "silence", "vad_type": "silero", "vad_confidence": 0.7, "vad_start_secs_vad": 0.2, "vad_stop_secs": 0.8, "turn_max_duration_secs": 30, "user_idle_timeout_secs": 60}Наблюдаемость и хранение
- Эндпоинт
/metricsдля Prometheus (счётчики запросов, гистограммы задержек, датчики активных соединений) - Запись: Полное аудио сессии в S3 с настраиваемым пулом воркеров и форматом
- Транскрипты: Хранение каждого сообщения в Postgres или MySQL с настраиваемой таблицей
- Эндпоинты
/healthи/readyс опциональной проверкой хранилища сессий Redis на/ready
Функции безопасности
server_api_keyзащищает/ws,/webrtc/offer,/start,/sessions/*черезAuthorization: BearerилиX-API-Key- Конфигурация белого списка CORS
- Конфигурация сертификата и ключа TLS
- Стиль 12-factor: JSON-конфигурация + переопределения переменных окружения
Такой бэкенд полезен разработчикам, создающим голосовые приложения реального времени, которым необходимо интегрировать несколько AI-сервисов с инфраструктурой, готовой к промышленной эксплуатации.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Бой Ботов: Арена ИИ-Агентов для Многопользовательских Игр, Созданная с Claude Code
Bot Fight — это арена, где ИИ-агенты играют друг против друга в покер, бильярд, Gorillas и змейку. Платформа полностью построена на коде Claude как монорепозиторий Next.js + Node с WebSockets и игровыми движками в реальном времени.

Расширение OpenClaw Claude обновлено для использования Agent SDK после изменений в системе биллинга Anthropic.
Разработчик расширения OpenClaw переписал свою интеграцию с CLI Claude, чтобы использовать официальный claude-agent-sdk после того, как Anthropic начал обнаруживать и переклассифицировать использование CLI как использование стороннего приложения, которое списывается из отдельного пула кредитов, а не из лимитов плана Max. Подход с SDK аутентифицируется через существующий вход в Claude Code и списывается как обычное использование плана Max.

Настройка Headless OpenClaw с Discord через Docker-скрипты
Репозиторий на GitHub предоставляет скрипты для запуска OpenClaw с Discord в headless-контейнере Docker, избегая TUI/WebUI. Он включает управляющий скрипт с командами, такими как claw init, start и stop, а также предварительно настроенную поддержку OpenAI Responses API, Chromium и различных инструментов.

Creation OS: Локальная σ-затворная среда выполнения LLM, позволяющая моделям говорить «Я не знаю» вместо галлюцинаций
Creation OS оборачивает локальные LLM (BitNet, Qwen, Gemma, любые GGUF) с σ-затвором, который измеряет несколько каналов неопределенности и принимает решение ACCEPT, RETHINK или ABSTAIN для каждого вывода. Без облака, без API. Точность TruthfulQA улучшена ~29% за счет селективной регенерации.