Screenbox:音声のみで構築されたAIエージェント向けオープンソース仮想デスクトップ

Screenboxの機能
Screenboxは、AIエージェント向けにDockerコンテナ内で隔離されたLinuxデスクトップを作成します。複数のAIエージェントを並列実行すると、通常は同じ画面、同じファイル、同じブラウザをめぐって競合が発生します。これにより、あるエージェントがファイルをダウンロードしている間に別のエージェントが上書きしたり、あるエージェントがChromeをクラッシュさせて別のエージェントがセッションを失ったりする問題が生じます。
主な特徴
- 各エージェントがDocker内で独自の隔離されたLinuxデスクトップを取得
- 完全なChromiumブラウザを含む
- 完全なファイルシステムの隔離
- ターミナルアクセス
- スクリーンショット、クリック、タイプ、シェル、ウィンドウ管理を含む21のMCPツール
- 人間がデスクトップで行えるすべての操作
開発詳細
このプロジェクトは、Claude Codeを使用した音声コマンドのみで完全に構築されました。作成者は「コードの一行も見たことがありません」と述べています。現在、仕事と個人プロジェクトの両方で毎日本番環境で稼働しています。
技術仕様
- ライセンス: AGPL-3.0
- GitHub: github.com/dklymentiev/screenbox
- ウェブサイト: screenbox.dev
- 実際のデスクトップでプロジェクト自体を使用しているデモ動画を公開
デモ動画のチャットパネルはデモンストレーション目的のモックですが、それ以外に表示されているものはすべて実際の機能です。
📖 Read the full source: r/ClaudeAI
👀 See Also

OnPrem.LLM エージェントエグゼキューター:組み込みツールを備えたサンドボックス化AIエージェントを起動
OnPrem.LLMのAgentExecutorは、クラウドまたはローカルモデルを使用して複雑なタスクを実行する自律型AIエージェントを作成できます。ファイル操作、シェルコマンド、ウェブ検索を含む9つの組み込みツールを備えており、セキュリティのためにサンドボックス化されたコンテナでエージェントを実行することも可能です。

AIエージェントによるLisp開発:高コストと技術的課題
あるDevOpsエンジニアが、AIエージェントがLisp開発に苦戦し、不十分なコードに対して数分で10~20ドルのコストがかかる一方、PythonやGoでは効率的に動作することを発見しました。彼はREPLの対話性を向上させるためにtmux-repl-mcpを作成しましたが、依然として高いトークンコストとツーリングの問題に直面しています。

フリートコマンダー:複数のClaude Codeエージェントチームを編成するためのオープンソースダッシュボード
Fleet Commanderは、異なる課題に対して複数のClaude Codeエージェントチームを並行して実行するローカルWebダッシュボードです。プランナー、開発者、レビュアーのエージェントで構成される「ダイヤモンドチーム」構造を採用し、SendMessageを通じてピアツーピアで通信します。

スクラップリングは、OpenClawのスクレイピングバックボーンとして統合されました。
Scraplingは、ページ構造を学習し変更に適応するオープンソースライブラリで、OpenClawのコアスクレイピングエンジンとして統合されました。BeautifulSoup with Lxmlよりも774倍高速で、非同期セッションによる複数のセレクタータイプをサポートしています。