OpenRouterモデルの価格設定とドルあたりのインテリジェンス分析

モデルの知能と価格比較
開発者が16のAIモデルのOpenRouter API価格を分析し、特定のタスクに適したモデルを選択するための知能対価値を計算しました。知能指標は7つのベンチマークを組み合わせたものです:Artificial Analysis Intelligence Index、Agentic Index、Coding Index、Artificial Analysis Omnicience Index(0-100に再スケーリング)、GPDval-AA、Terminal-Bench Hard、およびt2-Bench Telecom。
主な発見
分析により、いくつかの優れたモデルが特定されました:
- 最高の知能: GPT-5.4(知能58.8、100万トークンあたり2.50ドル)およびGemini 3.1 Pro(知能58.6、100万トークンあたり2.00ドル)
- 最高の価値: MiMo-V2-Flash(知能39.9、100万トークンあたり0.09ドル、価値スコア443)
- バランスモデル: GLM-5、Kimi K2.5、およびGemini 3 Flash
モデルの詳細と能力
完全なデータセットには以下が含まれます:
- MiMo-V2-Flash:知能39.9、100万トークンあたり0.09ドル、価値443、テキストのみ
- Step 3.5 Flash:知能34.8、100万トークンあたり0.10ドル、価値348、一般的な高速テキストタスク
- Grok 4.1 Fast:知能41.2、100万トークンあたり0.20ドル、価値205、200万トークンのコンテキストウィンドウ、高速ルーティングと抽出
- MiniMax M2.5:知能40.3、100万トークンあたり0.27ドル、価値149、オープンソース、実際のコーディングタスクで優れたパフォーマンス
- DeepSeek V3.2:知能34.6、100万トークンあたり0.25ドル、価値138、強力なコーディングと論理能力、APIキャッシュヒットをサポート
- Kimi K2.5:知能45.8、100万トークンあたり0.45ドル、価値101、26.2万トークンのコンテキストウィンドウ、幅広い一般知識
- Gemini 3 Flash:知能47.7、100万トークンあたり0.50ドル、価値95、マルチモーダルで音声入力をサポート
- GLM-4.7:知能31.6、100万トークンあたり0.38ドル、価値83、一般的なテキスト生成
- Qwen 3.5:知能41.1、100万トークンあたり0.60ドル、価値68、強力な全体的なパフォーマンス、汎用目的
- GLM-5:知能49.5、100万トークンあたり0.80ドル、価値61、20万トークンのコンテキストウィンドウ、一般知識
- Claude Haiku 4.5:知能36.5、100万トークンあたり1.00ドル、価値36、高速で安価、拡張思考をサポート
- GPT-5.3:知能55.9、100万トークンあたり1.75ドル、価値32、一般的な推論とテキスト処理
- GPT-5.2:知能50.8、100万トークンあたり1.75ドル、価値29、コーディングとエージェントタスクに優れる
- Gemini 3.1 Pro:知能58.6、100万トークンあたり2.00ドル、価値29、マルチモーダル分析、画像出力をサポート
- Grok 4.2 Beta:知能49.6、100万トークンあたり2.00ドル、価値25、高度な推論、幅広い知識ベース
- GPT-5.4:知能58.8、100万トークンあたり2.50ドル、価値24、可変コンテキスト階層(<27.2万トークン / >27.2万トークン)、最高レベルの推論
- Claude Sonnet 4.6:知能52.3、100万トークンあたり3.00ドル、価値17、主力モデル、2026年1月までトレーニング
- Claude Opus 4.6:知能51.9、100万トークンあたり5.00ドル、価値10、最高レベルの推論、コーディングとソフトウェアエンジニアリングで最強
注目すべき洞察
分析によると、より賢いモデルは通常、価値スコアが低くなりますが、これは実際の効率を反映していない可能性があります。例えば、Qwen 3.5が50万トークンと30分かけて問題を間違って解決する一方で、Sonnetがその10分の1の時間で正しく解決する場合、知能対価値スコアが低いにもかかわらず、Sonnetの方が価値が高いかもしれません。
Grok 4.1の200万トークンのコンテキストウィンドウは、ほとんどの使用ケースでは現れない知能向上をもたらします。MiniMax 2.5は、コンテキストウィンドウを除くすべての指標でそれを上回ります。
GLM-5は、価値が大幅に低下する前の最後のモデル(Claude Haiku 4.5で61から36へ)であり、GPT-5.2とほぼ同じくらい賢いと報告されています。
📖 Read the full source: r/openclaw
👀 See Also

Swarm Orchestra v2プラグイン、エージェント間メッセージングを追加しClaudeコードエージェントチームの混乱を解消
Swarm Orchestraは、Claude Codeの実験的なTeamCreate機能の問題を解決するプラグインです。この機能はエージェントの暴走を引き起こす可能性があります。バージョン2では、PreToolUseフックによるエージェント間メッセージングと、/teammateスキルによる自己設定機能が追加されました。

Claweの探求:オープンソースのマルチエージェント調整システム
Claweは、効率的なマルチエージェント調整を可能にするオープンソースツールで、スケジューリング、タスク管理、リアルタイム通知などの機能を提供します。

ClawControl iOSクライアントが、OpenClawセルフホストサーバー向けにリリースされました。
ClawControl v1.50がiOSで利用可能になりました。これは、セルフホスト型のOpenClaw/Clawサーバー向けのプライバシー重視のモバイルクライアントです。このオープンソースアプリは、モバイルデバイスからリアルタイムチャット(ストリーミング応答)、エージェント管理、セッション制御を可能にします。

cstat: Claude Code用のネイティブRustステータスライン、2msのパフォーマンスを実現
cstatはネイティブのRustバイナリで、24回のサブプロセス起動を排除することで、claude-hudの62msステータスラインを2ms実装に置き換えます。モデル情報、レート制限、gitステータス、コンテキストウィンドウ使用量、アクティブツール、サブエージェント、タスク進捗を表示します。