boxBot: ClaudeとHailo AI搭載のオープンソーススマートスピーカー

FunScore645という開発者がboxBotを構築しました。これは、厳格なルールではなく、Claudeを使ったエージェント駆動のハードウェア制御を採用したスマートスピーカーです。プロジェクトはgithub.com/dv-hart/boxbotでオープンソース化されており、まだ開発中ではありますが、日常の家族向けタスクにはすでに役立っています。
ハードウェアと構造
ハードウェアスタックは以下の通りです。
- Raspberry Pi(モデルは未指定)
- Hailo AIアクセラレータ(エッジ推論用と推測)
- Respeakerマイクアレイ
- Raspberry Piカメラ
- Waveshareディスプレイ
- スピーカー
筐体はウォールナット材で手作りされ、パッシブ冷却を採用。開発者はClaudeを使って熱負荷と放熱率を計算し、設計に反映しました。
エージェント駆動のアーキテクチャ
複雑な会話ルールの代わりに、エージェント(おそらくClaudeベース)がカスタムPython SDKを通じてハードウェアを直接制御します。主な機能は以下の通りです。
- 動的ミュート: エージェントが周囲の雑音や横の会話を無視するために、マイクをミュートするタイミングを決定。
- 割り込み処理: 明示的なルールなしに割り込みを管理するエージェント駆動のロジック。
- マルチチャンネル応答: 音声またはWhatsAppで応答可能で、エージェントが選択。
- ウィジェットベースの表示: 画面はJSONウィジェットフレームワークを使用。エージェントはスクリーンショットを介さずにJSONでウィジェットを読み取り、操作。
スキルシステムと柔軟性
エージェントは少数のツールセットを使用し、ほとんどのロジックはPythonスクリプトとboxBot SDKを通じて処理されます。スキルはMarkdownファイルで定義されます。例:開発者が家族のカレンダーイベントを追加したとき、妻がテキスト通知を希望。彼は.mdファイルに1行追加しただけで、エージェントはカレンダースキルを更新し、新しいイベントが入ると自動的にWhatsAppメッセージを送信するようになりました。
メモリとセキュリティ
開発者はカスタムメモリシステムとセキュリティ上の考慮事項(リビングルームのカメラとマイク)に言及していますが、詳細はコメントに委ねています。エージェントはセキュリティのためにハードウェアと密結合されています。
対象読者
AI駆動のハードウェアプロジェクトを構築し、エージェント制御の周辺機器とオープンソース基盤に興味のある開発者。
📖 出典: r/ClaudeAI
👀 See Also

パイロットプロトコル:AIエージェントスウォームのためのオープンソースP2Pネットワークスタック
Pilot Protocolは、AIエージェント間通信のために特別に設計されたオープンソースのレイヤー3およびレイヤー4オーバーレイネットワークスタックで、エージェント間の直接暗号化UDPトンネルと永続的な48ビット仮想アドレスを提供します。

時間とともにあなたのプロジェクトを学習するClaudeコードのシステム
開発者が、CLAUDE.mdファイル、プロジェクトの規約を含むdocsフォルダ、およびブートストラップ、改善、パターン捕捉のための3つのプロンプトを追加することで、Claude Codeがセッション間でコンテキストを保持できるようにするシンプルな設定を作成しました。

Claudeコード用ピークプラグイン:セッションメモリを自動的にナビゲート
PeekはClaude Code用のプラグインで、ユーザーの修正や好みを自動的にキャプチャして注入し、AIアシスタントを導きます。埋め込み検索、BM25、時間減衰、メタデータフィルターを融合した検索を使用して、手動でのプロンプトなしに関連するコンテキストを提供します。

ローカルRAGツールをNemotron Nano 9B v2とvLLMツールコールで構築
開発者が、単一のGPU上で完全に動作するローカルファーストのRAG研究ツールを構築しました。このシステムは、vLLM上でNemotron Nano 9B v2 Japaneseを使用し、ツール呼び出しのためのカスタムパーサープラグインを備えています。特徴として、二言語キーワード抽出と並列FTS5/DuckDuckGo検索を組み合わせた、抽出→実行の2段階フローを採用しています。