AIクエリ効率のための適応的推論ルーティング提案

✍️ OpenClawRadar📅 公開日: April 13, 2026🔗 Source
AIクエリ効率のための適応的推論ルーティング提案
Ad

概要

2026年4月にAnthropicの製品・エンジニアリングチームに提出された技術提案書で、高コストな計算が開始される前に複雑度評価に基づいてAIクエリを適切なモデル階層に自動的にルーティングする仕組みについて。

課題

現在、Claudeに送信されるすべてのクエリ(「卵を何分茹でるか」のような単純な質問から2,000語の技術的なプロンプトまで)は、デフォルトでフル機能モデルにルーティングされています。システムは計算リソースを割り当てる前に複雑度を評価しないため、大規模運用では非効率的です。AI推論はデータセンターのエネルギー消費の中で最も急速に成長している要素であり、2028年までに米国の電力消費の12%に達すると予測されています。

提案される解決策:5段階プロセス

  • ステップ1 — 計測: クエリの文字数、文数、添付ファイルや複数部分からなる指示の有無を測定
  • ステップ2 — 振り分け: 複雑度スコアに基づいてモデル階層にルーティング。単一の短い文は軽量モデルに、複数段落の文脈を含むプロンプトは高性能モデルに
  • ステップ3 — 読み取り: 割り当てられたモデルが通常通りクエリを処理
  • ステップ4 — 回答: ユーザーに応答を返す
  • ステップ5 — 昇格: ユーザーが不満を示した場合(反論する、深掘りを求める、言い換える)、システムは自動的により高性能なモデルに切り替えてフォローアップ
Ad

複雑度スコアリングの仕組み

システムは5要素の事前ルーティングスコアを使用:文字数、文数、添付ファイルの有無、疑問詞の密度、過去の会話の深さ。これにより、モデル推論を一切行わずに、相当な割合のクエリを正しく分類できます。文字数は一次信号として機能します。なぜなら、ほとんどの単純なクエリは短く、ほとんどの複雑なクエリは長いからです。

ユーザーエクスペリエンス設計

ユーザーはこのシステムを見たり、モデルを選択するよう求められたりすべきではありません。インターフェースは同一のままで、ルーティングは不可視です。回答が不十分な場合、ユーザーはさらに求めるとより多くの情報を受け取ります。これにより、非技術系ユーザーにHaiku、Sonnet、Opusなどのモデル階層から選択させるという摩擦がなくなります。

影響と根拠

Anthropicの規模では、クエリあたりの平均計算量を20〜30%削減するだけで、推論コストとエネルギー負荷の有意な削減につながります。この提案は、データセンターのエネルギー消費に関する規制やPR上の課題(複数の法域で立法問題になりつつある)に対して、Anthropicを有利な立場に置きます。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

ClaudeコードキャッシュのバグによりAPIコストが10~20倍増加する可能性あり
News

ClaudeコードキャッシュのバグによりAPIコストが10~20倍増加する可能性あり

Claude Codeの2つのキャッシュバグにより、APIコストが10〜20倍に静かに増加する可能性があります。これらの問題はRedditで報告され、Hacker Newsで議論されました。

OpenClawRadar
MetaのMCIツール、AIトレーニングのために従業員のやり取りを記録
News

MetaのMCIツール、AIトレーニングのために従業員のやり取りを記録

Metaは、米国従業員のコンピューターに「Model Capability Initiative(MCI)」と呼ばれる追跡ソフトウェアを導入し、マウスの動き、キーストローク、クリック、および時折の画面スナップショットをAIモデルトレーニング用に収集しています。このデータは、ドロップダウンメニューからの選択やキーボードショートカットの使用など、人間のコンピューター操作をAIが再現する能力を向上させることを目的としています。

OpenClawRadar
OpenClaw 3.31 アップデートにより、エージェントの権限と設定がリセットされます
News

OpenClaw 3.31 アップデートにより、エージェントの権限と設定がリセットされます

OpenClaw アップデート 3.31 では、すべてのエージェントツール、コンピューターアクセス権限、およびサブエージェントが自動的に無効化され、設定から手動で再有効化する必要があります。また、このアップデートでは権限リクエストの仕組みが変更され、使用中の承認プロンプトが表示されなくなりました。

OpenClawRadar
Claude Code v2.1.73:モデルオーバーライド、安定性修正、パフォーマンス改善
News

Claude Code v2.1.73:モデルオーバーライド、安定性修正、パフォーマンス改善

Claude Code v2.1.73では、カスタムプロバイダーIDのためのmodelOverridesの追加、重大なフリーズとデッドロックの修正、サブエージェントのモデルダウングレードの解決、音声モードの安定性向上が行われました。このリリースでは、bashコマンドの権限プロンプト、セッションの破損、Linuxサンドボックスの失敗など、18の具体的な問題に対処しています。

OpenClawRadar