OpenClaw用のローカル音声テキスト変換にParakeet TDT 0.6b v3を使用

OpenClaw向けローカル文字起こしセットアップ
コミュニティの開発者が、NVIDIAのParakeet TDT 0.6b v3モデルをOpenClaw内でのローカル音声文字起こし用に適応させました。このモデルはONNX推論をCPU上で実行し、APIコストを削減しながら25のヨーロッパ言語をサポートします。
技術的実装
このソリューションは、CPUデプロイメント用のDockerコンテナを提供するGitHubリポジトリ(groxaxo/parakeet-tdt-0.6b-v3-fastapi-openai)を使用しています。コンテナはhttp://127.0.0.1:5092/v1でOpenAI互換のAPIエンドポイントを公開します。
サポート言語には以下が含まれます:ブルガリア語(bg)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ハンガリー語(hu)、イタリア語(it)、ラトビア語(lv)、リトアニア語(lt)、マルタ語(mt)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スウェーデン語(sv)、ロシア語(ru)、ウクライナ語(uk)。
OpenClawとの統合
開発者は文字起こし用のPythonスクリプトを提供しています:
#!/home/openclaw/.local/share/pipx/venvs/openai/bin/python
import sys
from openai import OpenAI
client = OpenAI(
base_url="http://127.0.0.1:5092/v1",
api_key="sk-no-key-required"
)
audio_file = open(sys.argv[1], "rb")
transcript = client.audio.transcriptions.create(
model="parakeet-tdt-0.6b-v3",
file=audio_file,
response_format="text"
)
print(transcript)
このスクリプトはOpenClawのopenclaw.jsonファイルで設定できます:
"tools": {
"media": {
"audio": {
"enabled": true,
"models": [
{
"type": "cli",
"command": "/home/openclaw/.local/bin/transcribe",
"args": ["{{MediaPath}}"],
"timeoutSeconds": 60
}
]
}
}
}あるいは、OpenClawはスクリプト内のモデル名とダミーAPIキーを使用して、OpenAI互換APIエンドポイントを直接利用するように設定することもできます。
デプロイメントに関する注意点
開発者はM4 Pro搭載Mac Mini上のARM64 Ubuntu Linux VMでテストを行い、適切なIntel互換CPUであれば十分な速度で動作すると指摘しています。DockerコンテナはGitHubリポジトリのREADMEの指示に従って構築されます。
📖 全文を読む: r/openclaw
👀 See Also

ミエリン:Claudeコード手続き記憶のためのMD抽出・評価ツール
Myelinは、PostToolUseを介してClaude Codeに接続するMCPサーバーで、ツール呼び出しをキャプチャし、成功したセッションから.md手順ファイルを自動的に抽出し、Claudeが既存の手順を段階的にフォローしているかどうかを追跡します。

LLMsは明示的な指示にもかかわらず、構造化された出力に推論を漏洩させる
Claudeへの並列API呼び出しを行い構造化出力を解析するツールを開発している開発者は、検証モデルが修正されたテキストのみを返すよう明示的に指示されているにもかかわらず、断続的に推論テキストを出力してから修正内容を返す問題に遭遇しました。解決策は、プロンプトの厳格化と、解析前に実行する防御的な除去関数の組み合わせでした。

VSCode-Perplexity-MCP: VS Codeで無料のAI検索にPerplexityアカウントを使用する
Perplexity.aiアカウントをVS Codeに接続し、APIリクエストごとに支払うことなくClawbotに検索、推論、計算機能を提供するオープンソースのMCPサーバー。

PocketBot:App Intentsとオンデバイス推論を活用したiOS向けローカルAIオートパイロット
PocketBotは、iPhoneのNeural Engine上でMetalを介して量子化された3B Llamaモデルをローカルで実行するiOSアプリです。AppleのAppIntentsおよびCoreLocationフレームワークを使用し、クラウドへのデータ送信なしでイベント駆動型の自動化を実現します。