Transcripción local de voz a texto para OpenClaw utilizando Parakeet TDT 0.6b v3

✍️ OpenClawRadar📅 Publicado: 3 de marzo de 2026🔗 Source
Transcripción local de voz a texto para OpenClaw utilizando Parakeet TDT 0.6b v3
Ad

Configuración local de transcripción para OpenClaw

Un desarrollador de la comunidad ha adaptado el modelo Parakeet TDT 0.6b v3 de NVIDIA para la transcripción local de voz a texto dentro de OpenClaw. El modelo se ejecuta mediante inferencia ONNX en CPU, eliminando los costos de API y admitiendo 25 idiomas europeos.

Implementación técnica

La solución utiliza un repositorio de GitHub (groxaxo/parakeet-tdt-0.6b-v3-fastapi-openai) que proporciona un contenedor Docker para implementación en CPU. El contenedor expone un endpoint de API compatible con OpenAI en http://127.0.0.1:5092/v1.

Los idiomas admitidos incluyen: búlgaro (bg), croata (hr), checo (cs), danés (da), neerlandés (nl), inglés (en), estonio (et), finés (fi), francés (fr), alemán (de), griego (el), húngaro (hu), italiano (it), letón (lv), lituano (lt), maltés (mt), polaco (pl), portugués (pt), rumano (ro), eslovaco (sk), esloveno (sl), español (es), sueco (sv), ruso (ru) y ucraniano (uk).

Ad

Integración con OpenClaw

El desarrollador proporciona un script de Python para la transcripción:

#!/home/openclaw/.local/share/pipx/venvs/openai/bin/python
import sys
from openai import OpenAI

client = OpenAI( base_url="http://127.0.0.1:5092/v1", api_key="sk-no-key-required" )

audio_file = open(sys.argv[1], "rb") transcript = client.audio.transcriptions.create( model="parakeet-tdt-0.6b-v3", file=audio_file, response_format="text" ) print(transcript)

Este script se puede configurar en el archivo openclaw.json de OpenClaw:

"tools": {
    "media": {
        "audio": {
            "enabled": true,
            "models": [
                {
                    "type": "cli",
                    "command": "/home/openclaw/.local/bin/transcribe",
                    "args": ["{{MediaPath}}"],
                    "timeoutSeconds": 60
                }
            ]
        }
    }
}

Alternativamente, OpenClaw se puede configurar para usar directamente el endpoint de API compatible con OpenAI con el nombre del modelo y la clave API ficticia del script.

Notas de implementación

El desarrollador probó esto en una máquina virtual Ubuntu ARM64 en un Mac Mini con M4 Pro, señalando que debería ejecutarse razonablemente rápido en cualquier CPU compatible con Intel decente. El contenedor Docker se construye siguiendo las instrucciones del README en el repositorio de GitHub.

📖 Read the full source: r/openclaw

Ad

👀 Ver también

Engram: Plugin de Memoria Híbrida para Agentes OpenClaw — Búsqueda Vectorial + Semántica con Decaimiento
Herramientas

Engram: Plugin de Memoria Híbrida para Agentes OpenClaw — Búsqueda Vectorial + Semántica con Decaimiento

Engram ofrece a los agentes OpenClaw memoria persistente entre sesiones usando SQLite+FTS5 para recuerdos exactos y LanceDB para búsqueda semántica, con clases de decadencia y ganchos de captura automática.

OpenClawRadar
Flujo de trabajo de desarrollo guiado por especificaciones para Claude Code: Descomposición, limpieza de contexto y control de costos
Herramientas

Flujo de trabajo de desarrollo guiado por especificaciones para Claude Code: Descomposición, limpieza de contexto y control de costos

Un enfoque de desarrollo guiado por especificaciones para Claude Code que utiliza descomposición bidimensional, limpieza de contexto entre pasos y especificaciones escritas en disco para mejorar el rendimiento del agente y reducir costos.

OpenClawRadar
Clawforce: Plano de Control de Código Abierto para Gestionar Equipos de Agentes Clawbot
Herramientas

Clawforce: Plano de Control de Código Abierto para Gestionar Equipos de Agentes Clawbot

Clawforce es un plano de control de código abierto para gestionar equipos de agentes Clawbot que permite el despliegue con unos pocos clics. Proporciona configuración de personajes, habilidades, integraciones MCP y herramientas a través de una interfaz de usuario, con agentes capaces de planificar, coordinar y ejecutar tareas de manera colaborativa.

OpenClawRadar
Sistema de Estudio con Contexto Diseñado para Claude Code Actúa como Tutor Persistente
Herramientas

Sistema de Estudio con Contexto Diseñado para Claude Code Actúa como Tutor Persistente

Un desarrollador creó un sistema de estudio utilizando Claude Code que rastrea el progreso entre sesiones, evalúa la comprensión, trabaja con ejercicios y se adapta a los estilos de aprendizaje. El sistema utiliza archivos markdown estructurados para moldear el comportamiento del agente e incluye herramientas para extraer páginas de libros de texto de archivos PDF.

OpenClawRadar