コスト効率の高いAIタスクルーティングのためのRouteLLMセットアップ

✍️ OpenClawRadar📅 公開日: March 9, 2026🔗 Source
コスト効率の高いAIタスクルーティングのためのRouteLLMセットアップ
Ad

ハイブリッドAIセットアップのためのDocker Compose構成

Redditユーザーが、「貧者のスーパーインテリジェンス」と呼ぶハイブリッドAIシステムを実装した詳細なDocker Composeセットアップを投稿しました。このシステムは、複雑度に基づいてタスクをローカルモデルとクラウドモデル間でルーティングします。

主要コンポーネント

このシステムは4つの主要サービスを使用します:

  • vscode-openwire:イメージsendmeticket/vscode-openwire:1.0.0を使用し、ポート3000と3030を公開。これによりOpenWire経由でGitHub Copilotにアクセスできますが、ソースではこれが利用規約に違反する可能性があり、代わりに利用可能なAPIキーの使用を推奨しています。
  • ollamaollama/ollama:latestを実行し、ポート11434を公開。ローカルの「弱い」モデルとしてqwen3.5:4bモデルを自動的にプルして提供します。
  • openroutellm:イメージsendmeticket/openroutellm:1.0.0をポート6060で使用。これは各リクエストをどのモデルが処理するかを決定するルーティングサービスです。
  • openclawghcr.io/openclaw/openclaw:latestを実行し、ポート18789と18790を公開。メインインターフェースとして機能します。
Ad

RouteLLM構成

openroutellmサービスは特定のパラメータで構成されています:

python -m routellm.openai_server --routers bert --default-router-threshold 0.75 --port 6060 --openwire-base-url http://vscode-openwire:3030/v1 --ollama-base-url http://ollama:11434/v1 --strong-model gpt-4o --weak-model qwen3.5:4b

このセットアップは、BERTベースのルーティングと0.75の閾値を使用して、タスクを「強い」モデル(GPT-4o)とローカルの「弱い」モデル(Qwen3.5:4b)のどちらに送るかを決定します。

動作の仕組み

このシステムは、難しいタスクをOpenWire/Copilot経由で有料のGPT-4oモデルにルーティングし、単純なタスクはOllamaで実行されているローカルのQwen3.5:4bモデルで処理します。これにより、作者が「フェイルセーフでローカルファースト、低い基本知能だが非常に高い最大知能を持つAIモデル」と表現するものが実現されます。

すべてのサービスはカスタムDockerネットワーク(openclaw_net、サブネット172.10.10.0/24)を介して接続され、サービスの可用性を確保するためのヘルスチェックが含まれています。

📖 完全なソースを読む: r/LocalLLaMA

Ad

👀 See Also

Claude使用状況バーカラーライザーブラウザ拡張機能(Claude Codeで構築)
Tools

Claude使用状況バーカラーライザーブラウザ拡張機能(Claude Codeで構築)

開発者が、使用率のパーセンテージに基づいてクロードの使用状況バーを緑から黄色、赤へと色分けするブラウザ拡張機能を作成しました。この拡張機能は、リアルタイムの使用状況データをポップアップで表示し、閾値と色のカスタマイズを可能にします。拡張機能はクロードの使用状況ページでのみ動作し、設定はローカルに保存され、外部へのネットワークリクエストは一切行いません。

OpenClawRadar
OpenClawスキルは、ローカルのComfyUIサポートと厳選されたプロンプトを備えたAI画像生成機能を追加します。
Tools

OpenClawスキルは、ローカルのComfyUIサポートと厳選されたプロンプトを備えたAI画像生成機能を追加します。

新しいOpenClawスキル「creative-toolkit」は、ターミナル環境内で直接AI画像生成機能を提供します。1,300以上の厳選されたプロンプト、ローカルComfyUI統合、プロンプト拡張ワークフローを特徴としています。

OpenClawRadar
エージェントファクトリー:永続的なAIサブエージェントチームのためのClaudeコードプラグイン
Tools

エージェントファクトリー:永続的なAIサブエージェントチームのためのClaudeコードプラグイン

Agent-factoryは、Claude Codeのプラグインで、個性とファイルベースのメモリを持つ永続的なサブエージェントチームを作成します。対話型インタビュープロセスを通じてプロジェクトごとに2〜5人のエージェントを構築し、各エージェントにはコードレビュー、技術的負債の追跡、戦略立案などの特定の役割があります。

OpenClawRadar
Cull: AI画像パイプラインのためのオープンソースデータセットキュレーションエンジン
Tools

Cull: AI画像パイプラインのためのオープンソースデータセットキュレーションエンジン

Cullは、Civitai、X/Twitter、Reddit、Discord、booruサイトなど340以上のソースから画像をスクレイピングし、ローカルのLM StudioまたはGroqを介してビジョン言語モデルで分類し、SDプロンプトと監査レコードとともにカテゴリフォルダに整理します。

OpenClawRadar