OpenClaw Alexa Voice Proxyは双方向音声インタラクションを可能にします

openclaw-alexa-voiceは、AlexaカスタムスキルをOpenClawゲートウェイに接続するNode.jsプロキシで、メール、カレンダー、財務などのツールへの完全なアクセスを可能にしながら音声インタラクションを実現します。このシステムは、さまざまな種類のクエリを効率的に処理するために3段階の応答アーキテクチャを実装しています。
3段階応答システム
プロキシは、複雑さと処理時間に基づいて応答を3つのパスに分類します:
- 高速パス(<1秒) – 時間、日付、カスタムAPIなどのシンプルなクエリを処理
- エージェントパス(<12秒) – AIメモリからの迅速な回答を提供
- 遅延パス(<2分) – 複雑なクエリを非同期で処理し、Home Assistant TTSを介して任意のスピーカーで再生
仕組み
クエリがツールアクセス(メール、ウェブ検索、市場データ)を必要とする場合、Alexaは「確認します」と応答してセッションを閉じます。プロキシはその後、クエリを完全なツールアクセスを持つOpenClawのメインセッションに送信し、最大2分間待機し、マークダウン形式を除去し、Home AssistantのAlexa Media Player統合を介して任意のEchoまたはSonosデバイスで応答を再生します。
主な機能
- 音声PIN認証(1時間セッション)
- マルチスピーカーTTSルーティング(任意のEcho、Sonos、スピーカーグループ)
- カスタムAPI用の拡張可能な高速応答システム
- TTS失敗時のTelegramフォールバック
- Alexaリクエスト署名検証
- レート制限と監査ログ
- セキュリティのためのlocalhostのみへのバインド
技術スタック
この実装では、プロキシにNode.js、音声インターフェースにAlexaカスタムスキル、通信にOpenClawゲートウェイWebSocket、TTS再生にHome Assistantを使用しています。このアプローチにより、開発者はOpenClawインスタンスに音声機能を拡張しながら、ローカルバインドと認証によるセキュリティを維持できます。
このプロジェクトはディスカッション#11154に触発され、OpenClawセットアップに音声インタラクションを追加したい開発者向けにオープンソースとして公開されています。3段階システムにより、応答性の高い音声インタラクションを確保しつつ、複雑なクエリでもOpenClawの完全なツール機能を活用できます。
📖 完全なソースを読む: r/openclaw
👀 See Also

AIトークンモニター:macOSツールがローカルのClaude使用状況とコストを追跡
開発者がAI Token Monitorを構築しました。これはmacOSのメニューバーアプリで、ローカルのClaudeセッションファイルを読み取り、APIキーなしでトークン使用量、モデル分布、コスト換算を追跡します。このオープンソースツールは、あるユーザーのケースで35日間に650万トークン(API価格で4,924ドル相当)を記録しました。

NPCterm: AIエージェント向けMCP経由の完全PTYターミナルエミュレータ
NPCtermは、MCP(Model Context Protocol)を介して公開される、AIエージェント向けのヘッドレス・インメモリ完全PTY端末エミュレータです。15個のMCPツールを備え、端末制御、プロセス状態検出、およびTUIアプリケーションのサポートを提供します。

iai-mcp: セッションをまたいだ持続的なOpenClawメモリのためのローカルデーモン
iai-mcpは、すべてのOpenClawの会話をキャプチャし、ローカルのニューラル埋め込みとAES-256暗号化を用いて3つのメモリ階層に保存し、新しいセッションで関連するコンテキストをフィードバックするオープンソースのデーモンです。逐語的再現率>99%、検索<100ms、セッション開始時のトークンコスト<3k。

克劳德设计与华数设计:HTML布局与速率限制的直面交锋
Claude DesignはHTMLプロトタイプを高速に作成できますが、すぐにレート制限に達します。オープンソースのClaude CodeスキルであるHuashu-Designは、通常のサブスクリプションで動作し、個別のレート制限はありませんが、5分に対して20分かかります。