金融モデラーがClaude Codeでローカル音声ツールデスクトップアプリを構築

プロフェッショナルなコーディング経験を持たない開発者が、Claude Codeを使用して完全に機能するローカル音声認識デスクトップアプリケーションを構築しました。主に金融モデリングでExcelとSQLを使用しているこの開発者は、クラウドベースのサブスクリプションサービスに代わるツールとして作成しました。
構築されたもの
このアプリケーションは「Sotto」と呼ばれる、GPU上でWhisperを実行するWindows向けローカル音声認識ツールです。開発者は、高性能なハードウェア(具体的には4070 Ti GPU)を持っているにもかかわらず、音声データがマシンから離れてしまうクラウドベースの音声入力サービスへの不満から動機づけられました。
主な機能
- 任意のアプリケーションからアクセス可能なシステム全体のホットキー
- 話し終わると自動的に録音を停止
- 長い音声メモ用の第2ホットキー(Obsidian互換のマークダウン形式でエクスポート)
- システムトレイ統合付き設定UI
- リスニング中の視覚的波形インジケーター
- 自動GPU検出とモデル選択
- カーソル位置へのテキスト挿入
技術的詳細
このアプリケーションは、17ファイルに約2,200行のPythonコードで構成されています。開発者によると、Claude Codeが「大部分」の実装を担当し、以下を含みます:
- スレッド処理ロジック
- Windows API統合
- Qtベースのユーザーインターフェース
開発者は要件定義、テスト、バグ特定、機能優先順位付けを担当し、技術的コンポーネントの実際の実装については、自身が構築方法を知らない部分をClaude Codeに依存しました。
入手可能性
SottoはMITライセンスの下で利用可能で、以下の要件があります:
- Windowsオペレーティングシステム
- Python 3.10以上
- GPU推奨(必須ではありません)
開発者は、最近MacBookを購入し、そこでこのツールを使用したいため、Mac版が「近日公開予定」であると述べています。プロジェクトはGitHubでホストされています:https://github.com/mrobison12-oss/sotto。
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude Codeを用いたプロダクションコードベースでの自動研究:60の実験、3つの変更を保持
開発者は、本番環境のハイブリッド検索システム(Django、pgvector、Cohere埋め込み)でClaude Codeを用いて60回のオートリサーチを実行し、93%の失敗率でわずか3つの変更のみを採用しました。このプロセスにより、効果のない最適化が特定され、Redisキャッシュのバグが発見されました。

OpenClawビデオ作成プロセス:自動化を80%削減し、品質を向上
開発者がアニメーションビデオ作成のための洗練されたOpenClawワークフローを共有し、自動化を80%に削減しながら、より良いプロンプトエンジニアリング、複数のクリップ生成、手動の後処理ステップを通じて品質を向上させています。

Qwen 3.6 27B Q8_k_xl を VSCode のローカル日常ドライバーとして
ある開発者が、RTX 6000 Pro上でLM Studioを介してVSCode InsidersにてUnslothによるQwen-3.6-27B-q8_k_xlを使用した経験を共有し、APIトークンなしで日常のコーディングタスクに「十分使える」と述べています。

Claude Skill File:交渉理論を電子メール作成に応用
ある開発者が、メール作成に交渉理論を適用するSKILL.mdファイルをClaude用に作成しました。このスキルは、BATNA(交渉合意の最善代替案)、アンカリング、互恵性といった交渉フレームワークを具体的に使用します。このスキルは、単一の一般的な返信ではなく、トレードオフ分析を含む2〜3通のバリエーションメールを生成します。