OpenUtter: OpenClaw経由でGoogle Meetの文字起こしをライブでクエリ

OpenUtterは、OpenClawエージェントがあなたに代わってGoogle Meetミーティングに参加できるようにするツールです。ライブ文字起こしをキャプチャし、テキストメッセージを介してリアルタイムでクエリできます。
仕組み
このツールはPlaywrightを使用して、招待リンクを介してゲストまたは認証済みアカウントとしてGoogle Meetに参加するステルスChromiumインスタンスを起動します。MeetのDOMにMutationObserverを注入して、字幕の更新が表示されるたびにキャプチャします。このツールは単語ごとのUI更新を重複排除し、クリーンなログ形式[タイムスタンプ] 話者: テキストに変換します。このログはOpenClawイベントバスを介してリアルタイムでストリーミングされます。
主な機能
- ライブクエリ: ミーティング実行中に、「今何について話しているの?」などの質問をOpenClawエージェントにテキストで送信できます。エージェントはライブ文字起こしの最後の20行を取得して返信します。
- スクリーンショットキャプチャ:「スクリーンショットを撮って」と送信すると、数秒以内にフルスクリーンキャプチャがチャットに表示されます。
- 複数ブリッジサポート:
--channelフラグを使用して、Telegram、WhatsApp、Slack、Discordを含む設定済みOpenClawブリッジにストリームをルーティングできます。 - LLM統合: ソースでは、文字起こしをLLM要約ツールにパイプし、通話終了時にアクションアイテムをSlackにプッシュすることが言及されています。
セットアップ
インストールには2つのコマンドが必要です:
npx openutter
npx playwright-core install chromiumGitHubリポジトリはhttps://github.com/sumansid/openutterで利用可能です。
実用的な使用法
このアプローチにより、物理的に出席せずにミーティングを監視できます。ソースで説明されているように:「参加していない通話の30分後に『彼らは何を決めたの?』とテキストで尋ねるのは、異なる働き方です。」ユーザーによると、ライブクエリ機能が最も頻繁に使用される機能のようです。
📖 完全なソースを読む: r/openclaw
👀 See Also

MCP + スキルフレームワーク:効率的なデータサイエンスワークフローのためのAIエージェントのガイド
MCPサーバー+スキルフレームワークを用いてClaude/GPTエージェントをプラットフォーム認識型で効率的なデータサイエンスワークフローに制約する実践的アプローチ — クライアント重いコードや不必要なデータ移動を回避。

Codiff v0.1.0: LLM生成コードレビュー用のローカル差分ビューア
Codiff v0.1.0は、ローカルのGit差分をレビューするための高速でミニマルなデスクトップアプリです。LLMウォークスルーモードと、Markdownとしてコピー可能なインラインコメントを備えています。

Claude Codeを使用したローカル音声認識macOSアプリの構築:Vextのケーススタディ
ある開発者が、macOS用音声テキスト変換アプリVextの開発に3か月を費やした話を共有しました。このアプリはApple Neural Engine上のWhisperを利用し、Claude CodeがRust/Swift FFI、Core ML最適化、ホットキーアーキテクチャを支援しました。完全オフラインで動作し、60秒の音声を約400msで文字起こしします。

nex-life-logger: OpenClawエージェント向けローカルアクティビティトラッカー
nex-life-loggerは、マシン上でローカルに実行されるバックグラウンドアクティビティトラッカーで、OpenClawエージェントにコンピュータ活動の記憶を提供します。ブラウザ履歴、アクティブウィンドウ、YouTubeトランスクリプトを追跡し、すべてをローカルのSQLiteデータベースに保存します。クラウドへのデータ送信はありません。