TranscriptionSuite v1.1.2は、WhisperX、NeMo、VibeVoiceモデルを追加しました。

✍️ OpenClawRadar📅 公開日: April 17, 2026🔗 Source
TranscriptionSuite v1.1.2は、WhisperX、NeMo、VibeVoiceモデルを追加しました。
Ad

TranscriptionSuite v1.1.2 リリース

完全ローカルでオープンソースの音声文字起こしアプリケーションであるTranscriptionSuiteは、コミュニティのフィードバックに基づいた重要な機能追加を含むバージョン1.1.2をリリースしました。

主な更新点

開発者は以前のfaster-whisper実装をWhisperXに置き換え、複数の新しいモデルファミリーのサポートを追加しました:

  • WhisperX - PyAnnoteによる話者分離機能を含む
  • NeMoモデル - ParakeetおよびCanaryモデルのサポート(PyAnnoteによる話者分離)
  • VibeVoiceモデル - メインモデルと4ビット量子化バージョンの両方をサポート(組み込みの話者分離機能付き)

新機能

  • モデルマネージャー - 異なる文字起こしモデルを管理するための一元化された制御
  • 並列処理モード - 文字起こしと話者分離の同時実行
  • ショートカットコントロール - ワークフロー改善のためのキーボードショートカット
  • カーソル位置への貼り付け - 直接テキスト挿入機能
  • 24kHz録音パイプライン - VibeVoiceモデルの機能を最大限に活用するために特別に追加(WhisperおよびNeMoモデルは16kHzを必要とします)

このアプリケーションは現在、選択したモデルファミリーに応じて異なる話者分離アプローチを持つ3つの異なる文字起こしパイプラインを提供しています。

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Skill Seekers v3.2.0は、ClaudeスキルのためのYouTubeチュートリアル抽出機能を追加しました。
Tools

Skill Seekers v3.2.0は、ClaudeスキルのためのYouTubeチュートリアル抽出機能を追加しました。

Skill Seekers v3.2.0は、YouTubeチュートリアルからコンテンツを抽出し、Claude用の構造化されたSKILL.mdファイルを作成するようになりました。このツールは、OCR出力をクリーンアップし、ビデオコンテンツから使用可能なドキュメントを生成するための2段階のAI強化ワークフローを使用しています。

OpenClawRadar
OpenClawの死角を修正:全Anthropicブログを取得するサイトマップの構築
Tools

OpenClawの死角を修正:全Anthropicブログを取得するサイトマップの構築

OpenClawのブラウザツールは、Anthropicのブログが複数のURLでホストされているため、すべてを発見できません。ユーザーが生成したサイトマップを読み込ませることで修正し、その解決策を共有可能なスキルとしてパッケージ化しました。

OpenClawRadar
マギー:クロスセッションメモリとP2Pチーム学習を備えたClaude Code上の自律型エンジニアリングプラットフォーム
Tools

マギー:クロスセッションメモリとP2Pチーム学習を備えたClaude Code上の自律型エンジニアリングプラットフォーム

MaggyはAIコーディングツールのスペクトラムのレベル4に位置します:マルチモデルオーケストレーション、セッションをまたぐメモリ、CI/レビューからのプロセスインテリジェンス、ピアツーピアチーム学習。ベンチマークでは、単一パイプラインのClaude Codeが見逃した7つのセキュリティ問題を捕捉しつつ、Claudeの使用量を83%削減しました。

OpenClawRadar
OpenClawの公開:AIコーディングエージェントを強化する方法
Tools

OpenClawの公開:AIコーディングエージェントを強化する方法

OpenClawがAIコーディングエージェントをどのように変革し、さまざまな領域で自動化を推進しているかをご覧ください。

OpenClawRadar