Claude Codeを使用したローカル音声認識macOSアプリの構築:Vextのケーススタディ

✍️ OpenClawRadar📅 公開日: April 29, 2026🔗 Source
Claude Codeを使用したローカル音声認識macOSアプリの構築:Vextのケーススタディ
Ad

ある開発者が、Vext——Apple Neural Engine上のWhisperを使用して完全にデバイス上で動作するネイティブmacOS音声テキスト変換アプリ——を構築した経験を共有しました。クラウドもアカウントもサブスクリプションも不要です。このアプリはRustコアにSwift/SwiftUI UI、Core MLによる推論を使用し、Claude Codeを主要なコーディングパートナーとしています。

主な機能

  • どこでもホットキーを押す → 話す → 離す → カーソル位置にテキストが表示
  • 60秒の音声を約400msで文字起こし(150倍のリアルタイム)
  • スマートなクリーンアップ:フィラーワードを除去、読みやすく発話を再構成
  • 99以上の言語へのリアルタイム翻訳
  • 話者分離と自動要約付き会議文字起こし
  • 音声録音中の画面収録(スクリーンショットを自動添付)

Claude Codeの成功点

  • Apple Silicon上のWhisper: 量子化戦略、モデルチャンク、Core ML変換のメモリレイアウトを効率的にNeural Engineで動作させるための反復を支援。
  • ホットキーシステムのアーキテクチャ: 適切なアクセシビリティ権限を持つCGEventTapの使用を提案し、録音開始/停止とクリップボードインジェクション間の競合状態のデバッグを支援。
  • Rust ↔ Swift FFI: FFIバインディングを生成し、Cインターフェース層のメモリ安全性の問題をいくつか発見。

Claude Codeの限界

  • macOS固有のAPIのニュアンス(CGEventTapのエッジケースなど)で苦戦し、Appleのヘッダーを直接調べる必要があった。
  • コンテキストウィンドウがRust + Swiftの全コードベースでボトルネックになったため、プロジェクトをモジュールに分割して一つずつ作業。

価格

getvext.appで無料ダウンロードおよび試用可能。永続利用は49ドルの一回払い(サブスクリプション不要)。コード VEXT50で50%オフ。

📖 ソース全文を読む: r/ClaudeAI

Ad

👀 See Also

エージェントX線: トレースログからAIエージェントの障害をデバッグするためのオープンソースツール
Tools

エージェントX線: トレースログからAIエージェントの障害をデバッグするためのオープンソースツール

Agent-Xrayは、MITライセンスのオープンソースツールで、AIエージェントのトレースログを分析し、spin、tool_bug、early_abortなどのカテゴリに失敗を分類します。また、敵対的チャレンジに対して修正をテストするための強制実行モードも含まれています。

OpenClawRadar
OpenHelm:自己修正リトライロジックを備えたClaude Code用ローカルバックグラウンドスケジューラー
Tools

OpenHelm:自己修正リトライロジックを備えたClaude Code用ローカルバックグラウンドスケジューラー

OpenHelmは、Tauriベースのアプリケーションで、Claude Codeのタスクをスケジュールに従ってバックグラウンドで実行し、すべての状態をローカルのSQLiteに保存します。失敗後にプロンプトを調整する自己修正型リトライループも含まれています。

OpenClawRadar
Devvit向けのClaudeスキルにより、コード生成の精度が73%から100%に向上しました。
Tools

Devvit向けのClaudeスキルにより、コード生成の精度が73%から100%に向上しました。

開発者がClaude用に構造化されたSKILL.mdプロンプトレイヤーを作成し、RedditのDevvitプラットフォーム向けのコンテキストを提供することで、一般的なDevvitタスクの評価結果を7/10から10/10に改善し、特定のランタイムバグを防止しました。

OpenClawRadar
claude-powerline v1.20は、TUIダッシュボードモード、コンテキストバーのスタイル、環境変数の表示機能を追加しました。
Tools

claude-powerline v1.20は、TUIダッシュボードモード、コンテキストバーのスタイル、環境変数の表示機能を追加しました。

claude-powerline v1.20では、TUIダッシュボードモードが導入され、単一のステータスラインが、モデル情報、プログレスバー付きのコンテキスト使用量、コスト、Gitステータスなどを表示するフルパネルに置き換えられました。このアップデートでは、コンテキスト使用量のための9種類の視覚的なプログレスバースタイルと、環境変数表示機能が追加されています。

OpenClawRadar