OpenRouter AIモデル価格比較：知能対価値ベストはMiMo-V2-Flash

モデルの知能と価格比較

開発者が16のAIモデルのOpenRouter API価格を分析し、特定のタスクに適したモデルを選択するための知能対価値を計算しました。知能指標は7つのベンチマークを組み合わせたものです：Artificial Analysis Intelligence Index、Agentic Index、Coding Index、Artificial Analysis Omnicience Index（0-100に再スケーリング）、GPDval-AA、Terminal-Bench Hard、およびt2-Bench Telecom。

主な発見

分析により、いくつかの優れたモデルが特定されました：

最高の知能： GPT-5.4（知能58.8、100万トークンあたり2.50ドル）およびGemini 3.1 Pro（知能58.6、100万トークンあたり2.00ドル）
最高の価値： MiMo-V2-Flash（知能39.9、100万トークンあたり0.09ドル、価値スコア443）
バランスモデル： GLM-5、Kimi K2.5、およびGemini 3 Flash

モデルの詳細と能力

完全なデータセットには以下が含まれます：

MiMo-V2-Flash：知能39.9、100万トークンあたり0.09ドル、価値443、テキストのみ
Step 3.5 Flash：知能34.8、100万トークンあたり0.10ドル、価値348、一般的な高速テキストタスク
Grok 4.1 Fast：知能41.2、100万トークンあたり0.20ドル、価値205、200万トークンのコンテキストウィンドウ、高速ルーティングと抽出
MiniMax M2.5：知能40.3、100万トークンあたり0.27ドル、価値149、オープンソース、実際のコーディングタスクで優れたパフォーマンス
DeepSeek V3.2：知能34.6、100万トークンあたり0.25ドル、価値138、強力なコーディングと論理能力、APIキャッシュヒットをサポート
Kimi K2.5：知能45.8、100万トークンあたり0.45ドル、価値101、26.2万トークンのコンテキストウィンドウ、幅広い一般知識
Gemini 3 Flash：知能47.7、100万トークンあたり0.50ドル、価値95、マルチモーダルで音声入力をサポート
GLM-4.7：知能31.6、100万トークンあたり0.38ドル、価値83、一般的なテキスト生成
Qwen 3.5：知能41.1、100万トークンあたり0.60ドル、価値68、強力な全体的なパフォーマンス、汎用目的
GLM-5：知能49.5、100万トークンあたり0.80ドル、価値61、20万トークンのコンテキストウィンドウ、一般知識
Claude Haiku 4.5：知能36.5、100万トークンあたり1.00ドル、価値36、高速で安価、拡張思考をサポート
GPT-5.3：知能55.9、100万トークンあたり1.75ドル、価値32、一般的な推論とテキスト処理
GPT-5.2：知能50.8、100万トークンあたり1.75ドル、価値29、コーディングとエージェントタスクに優れる
Gemini 3.1 Pro：知能58.6、100万トークンあたり2.00ドル、価値29、マルチモーダル分析、画像出力をサポート
Grok 4.2 Beta：知能49.6、100万トークンあたり2.00ドル、価値25、高度な推論、幅広い知識ベース
GPT-5.4：知能58.8、100万トークンあたり2.50ドル、価値24、可変コンテキスト階層（<27.2万トークン / >27.2万トークン）、最高レベルの推論
Claude Sonnet 4.6：知能52.3、100万トークンあたり3.00ドル、価値17、主力モデル、2026年1月までトレーニング
Claude Opus 4.6：知能51.9、100万トークンあたり5.00ドル、価値10、最高レベルの推論、コーディングとソフトウェアエンジニアリングで最強

注目すべき洞察

分析によると、より賢いモデルは通常、価値スコアが低くなりますが、これは実際の効率を反映していない可能性があります。例えば、Qwen 3.5が50万トークンと30分かけて問題を間違って解決する一方で、Sonnetがその10分の1の時間で正しく解決する場合、知能対価値スコアが低いにもかかわらず、Sonnetの方が価値が高いかもしれません。

Grok 4.1の200万トークンのコンテキストウィンドウは、ほとんどの使用ケースでは現れない知能向上をもたらします。MiniMax 2.5は、コンテキストウィンドウを除くすべての指標でそれを上回ります。

GLM-5は、価値が大幅に低下する前の最後のモデル（Claude Haiku 4.5で61から36へ）であり、GPT-5.2とほぼ同じくらい賢いと報告されています。

📖 Read the full source: r/openclaw