Claude Codeを使用したローカル音声認識macOSアプリの構築:Vextのケーススタディ

ある開発者が、Vext——Apple Neural Engine上のWhisperを使用して完全にデバイス上で動作するネイティブmacOS音声テキスト変換アプリ——を構築した経験を共有しました。クラウドもアカウントもサブスクリプションも不要です。このアプリはRustコアにSwift/SwiftUI UI、Core MLによる推論を使用し、Claude Codeを主要なコーディングパートナーとしています。
主な機能
- どこでもホットキーを押す → 話す → 離す → カーソル位置にテキストが表示
- 60秒の音声を約400msで文字起こし(150倍のリアルタイム)
- スマートなクリーンアップ:フィラーワードを除去、読みやすく発話を再構成
- 99以上の言語へのリアルタイム翻訳
- 話者分離と自動要約付き会議文字起こし
- 音声録音中の画面収録(スクリーンショットを自動添付)
Claude Codeの成功点
- Apple Silicon上のWhisper: 量子化戦略、モデルチャンク、Core ML変換のメモリレイアウトを効率的にNeural Engineで動作させるための反復を支援。
- ホットキーシステムのアーキテクチャ: 適切なアクセシビリティ権限を持つCGEventTapの使用を提案し、録音開始/停止とクリップボードインジェクション間の競合状態のデバッグを支援。
- Rust ↔ Swift FFI: FFIバインディングを生成し、Cインターフェース層のメモリ安全性の問題をいくつか発見。
Claude Codeの限界
- macOS固有のAPIのニュアンス(CGEventTapのエッジケースなど)で苦戦し、Appleのヘッダーを直接調べる必要があった。
- コンテキストウィンドウがRust + Swiftの全コードベースでボトルネックになったため、プロジェクトをモジュールに分割して一つずつ作業。
価格
getvext.appで無料ダウンロードおよび試用可能。永続利用は49ドルの一回払い(サブスクリプション不要)。コード VEXT50で50%オフ。
📖 ソース全文を読む: r/ClaudeAI
👀 See Also

エージェントX線: トレースログからAIエージェントの障害をデバッグするためのオープンソースツール
Agent-Xrayは、MITライセンスのオープンソースツールで、AIエージェントのトレースログを分析し、spin、tool_bug、early_abortなどのカテゴリに失敗を分類します。また、敵対的チャレンジに対して修正をテストするための強制実行モードも含まれています。

OpenHelm:自己修正リトライロジックを備えたClaude Code用ローカルバックグラウンドスケジューラー
OpenHelmは、Tauriベースのアプリケーションで、Claude Codeのタスクをスケジュールに従ってバックグラウンドで実行し、すべての状態をローカルのSQLiteに保存します。失敗後にプロンプトを調整する自己修正型リトライループも含まれています。

Devvit向けのClaudeスキルにより、コード生成の精度が73%から100%に向上しました。
開発者がClaude用に構造化されたSKILL.mdプロンプトレイヤーを作成し、RedditのDevvitプラットフォーム向けのコンテキストを提供することで、一般的なDevvitタスクの評価結果を7/10から10/10に改善し、特定のランタイムバグを防止しました。

claude-powerline v1.20は、TUIダッシュボードモード、コンテキストバーのスタイル、環境変数の表示機能を追加しました。
claude-powerline v1.20では、TUIダッシュボードモードが導入され、単一のステータスラインが、モデル情報、プログレスバー付きのコンテキスト使用量、コスト、Gitステータスなどを表示するフルパネルに置き換えられました。このアップデートでは、コンテキスト使用量のための9種類の視覚的なプログレスバースタイルと、環境変数表示機能が追加されています。