LinuxでのvLLM、Claude Code、gpt-oss-120bを使用したローカルマルチエージェントセットアップ

ある開発者が、Windowsから切り替えた後、Linux上で完全にローカルな並列マルチエージェントコーディング環境を作成した経験を共有しました。この構成では、並列推論にvLLM、エージェントオーケストレーションにClaude Code、コーディングタスクに大規模言語モデルを使用しています。
環境構成要素
- vLLM Dockerコンテナ: 簡単なデプロイと並列推論に使用
- Claude Code: バイブコーディングとエージェントチームのオーケストレーションを担当。クラウドプロバイダーではなくvLLMのlocalhostエンドポイントを指すように設定
- gpt-oss:120b: コーディングエージェントとして機能
- RTX Pro 6000 Blackwell MaxQ: ワークロード用の主要GPU
- デュアルブートUbuntu: オペレーティングシステムのセットアップ
パフォーマンスとワークフローの改善
この開発者は以前、OllamaとLM Studioを使用していましたが、それらはリクエストを逐次処理し、複数のメッセージターンやツール呼び出しの後に速度低下が発生していました。vLLMを使用することで、体験を「ターボチャージ」する並列処理を実現しました。
テストでは、このセットアップは動画デモで示されたように4つのエージェントが同時に協調作業することを処理でき、GPUは8つのエージェントを連続して並列でサポート可能でした。唯一指摘された問題は、エージェントによって異なるスループットの低下でした。
以前は逐次的に完了するのに数時間かかっていたエージェントチーム規模のタスクが、プロジェクトの範囲によっては約30分で完了できるようになりました。開発者は、2つ目のMaxQ GPUを追加することで、システムが数十のエージェントを同時に処理できる可能性があると推定しています。
この並列アプローチにより、ローカルで複数のプロジェクトを同時にバイブコーディングすることが可能になりますが、特定のシナリオでは若干のレイテンシ増加を引き起こす可能性があります。開発者は、このトレードオフを、一度に1つのエージェントでプロジェクトを完了させるよりも好ましいと感じました。
📖 Read the full source: r/LocalLLaMA
👀 See Also

クロードユーザーは、難しい会話のためのAI間コミュニケーションを実験しています。
2人のClaudeユーザーが、関係性の問題などのデリケートな話題について、AIアシスタント同士を直接コミュニケーションさせる実験を行いました。各メッセージは送信前に本人が確認し、この実験は言葉にされていなかった感情を表面化させ、難しい会話のための翻訳レイヤーとして機能しました。

左翼支持AI的理由:残障、慢性病与阶级
ショーン・ゲーデケ氏は、LLMが障害者支援、慢性疾患患者の医療機関への対応補助、階級に基づく官僚的な言葉へのコードスイッチングを可能にすることで、左派の価値観に貢献すると論じています。

OpenClaw YouTubeチャンネル管理テスト(コメントエージェント連携)
開発者がOpenClawのYouTubeチャンネル管理能力をテストし、毎日の動画生成と自動コメント機能を検証しました。システムはトピック選択、スクリプト作成、音声合成、サムネイル作成、エフェクト追加、アップロード、スケジューリングを処理しましたが、コメントボットが自動返信エージェントと対話した際に無限会話ループが発生しました。

クロード・コード、未完成プロジェクトから完全なマルチプレイヤーゲームをリリース
開発者がClaude Codeを使用して、競争的な推測ゲーム「Closer」を完成させたことを報告しました。このゲームでは、プレイヤーが実世界の統計を推測し、AIや友人と対戦します。Supabase Realtimeによるリアルタイムマルチプレイヤー機能、ELOランキングシステム、パーセンタイルランキング付きのデイリーチャレンジ、行動分析ダッシュボード、クライアントサイドルーティング、信頼度調整トラッキングが追加されました。