Локальная транскрипция речи в текст для OpenClaw с использованием Parakeet TDT 0.6b v3.

✍️ OpenClawRadar📅 Опубликовано: 3 марта 2026 г.🔗 Source
Локальная транскрипция речи в текст для OpenClaw с использованием Parakeet TDT 0.6b v3.
Ad

Локальная настройка транскрипции для OpenClaw

Сообщество разработчиков адаптировало модель NVIDIA Parakeet TDT 0.6b v3 для локального преобразования речи в текст в рамках OpenClaw. Модель работает через вывод ONNX на CPU, что исключает затраты на API и поддерживает 25 европейских языков.

Техническая реализация

Решение использует репозиторий GitHub (groxaxo/parakeet-tdt-0.6b-v3-fastapi-openai), который предоставляет Docker-контейнер для развёртывания на CPU. Контейнер предоставляет совместимую с OpenAI конечную точку API по адресу http://127.0.0.1:5092/v1.

Поддерживаемые языки включают: болгарский (bg), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), венгерский (hu), итальянский (it), латышский (lv), литовский (lt), мальтийский (mt), польский (pl), португальский (pt), румынский (ro), словацкий (sk), словенский (sl), испанский (es), шведский (sv), русский (ru) и украинский (uk).

Ad

Интеграция с OpenClaw

Разработчик предоставляет скрипт на Python для транскрипции:

#!/home/openclaw/.local/share/pipx/venvs/openai/bin/python
import sys
from openai import OpenAI

client = OpenAI( base_url="http://127.0.0.1:5092/v1", api_key="sk-no-key-required" )

audio_file = open(sys.argv[1], "rb") transcript = client.audio.transcriptions.create( model="parakeet-tdt-0.6b-v3", file=audio_file, response_format="text" ) print(transcript)

Этот скрипт можно настроить в файле openclaw.json OpenClaw:

"tools": {
    "media": {
        "audio": {
            "enabled": true,
            "models": [
                {
                    "type": "cli",
                    "command": "/home/openclaw/.local/bin/transcribe",
                    "args": ["{{MediaPath}}"],
                    "timeoutSeconds": 60
                }
            ]
        }
    }
}

Кроме того, OpenClaw можно настроить для прямого использования совместимой с OpenAI конечной точки API с именем модели и фиктивным ключом API из скрипта.

Примечания по развёртыванию

Разработчик протестировал это на виртуальной машине ARM64 Ubuntu Linux на Mac Mini с M4 Pro, отметив, что она должна работать достаточно быстро на любом приличном совместимом с Intel CPU. Docker-контейнер собирается в соответствии с инструкциями README в репозитории GitHub.

📖 Прочитать полный источник: r/openclaw

Ad

👀 Смотрите также

Навык GAN для Claude Code: Инструмент на основе состязательного ИИ для совершенствования идей
Инструменты

Навык GAN для Claude Code: Инструмент на основе состязательного ИИ для совершенствования идей

Навык Claude Code под названием /gan использует состязательные роли ИИ для критики и улучшения идей посредством чередующихся фаз Дискриминатора и Генератора, с такими функциями, как режимы интенсивности, вывод на нескольких языках и принудительный выбор роли, разработанными через самоитерацию.

OpenClawRadar
Инди-разработчик представил CLI-инструмент 'Ideanator' для структурирования неопределенных идей с помощью локальных языковых моделей.
Инструменты

Инди-разработчик представил CLI-инструмент 'Ideanator' для структурирования неопределенных идей с помощью локальных языковых моделей.

Идеанатор — это CLI инструмент, разработанный самоучкой 19-летним разработчиком с использованием локальных LLM, таких как Ollama/MLX. Он преобразует неопределенные идеи в четко определенные концепции, полностью офлайн.

OpenClawRadar
Octopoda: Открытый слой памяти для локальных ИИ-агентов
Инструменты

Octopoda: Открытый слой памяти для локальных ИИ-агентов

Octopoda — это открытый слой памяти, который предоставляет локальным ИИ-агентам постоянную память между сессиями, семантический поиск, обнаружение циклов и восстановление после сбоев. Работает полностью офлайн с 33-мегабайтной моделью эмбеддингов и интегрируется с LangChain, CrewAI, AutoGen и OpenAI Agents SDK.

OpenClawRadar
Параллельная архитектура чата Claude для разработки на Next.js
Инструменты

Параллельная архитектура чата Claude для разработки на Next.js

Разработчик создал систему для одновременного запуска нескольких чатов Claude AI на одной кодовой базе Next.js с использованием общей таблицы базы данных и опрашивающего агента, достигнув 87% успешных сборок без единого конфликта слияния за одну сессию.

OpenClawRadar