現在のLLMコスト比較:Deepseek、Qwen、MiniMax対OpenAI

プロバイダー別価格詳細
最近のReddit分析に基づく主要LLMプロバイダーの現在のコスト比較です。すべての価格は100万トークンあたりの米ドルで、分析日時点の情報です。
- Deepseek-V3.2: 入力0.26ドル / 出力0.38ドル。これはGPT-4の約10分の1のコストでありながら、ベンチマークが示すところではGPT-5クラスの性能を提供します。
- Qwen3.5シリーズ: 27Bモデルは入力0.26ドル / 出力2.60ドルで、Claudeに匹敵する品質をはるかに低コストで実現します。このシリーズは0.8Bから397TBパラメータまで柔軟性があり、すべてのバリアントが262kのコンテキストウィンドウ(1M+まで拡張可能)をサポートし、内蔵思考モードを備えています。
- MiniMax-M2.5: 入力0.27ドル / 出力0.95ドル。SWEベンチで80.2%を記録し、コーディングワークフローに優れており、エージェント型コーディングタスクで傑出しています。
- OpenAI GPT-4.1: 入力2.00ドル / 出力8.00ドル。確かに高性能ですが、代替モデルが同等の性能を発揮する場合、大量生産ユースケースでは価格プレミアムを正当化するのは困難です。
主要な技術的背景
この分析には、利用可能な場合はLMSYS ELOスコアが含まれています。他のほとんどのベンチマークは現時点で最適化されているように見えるためです。コンテキストウィンドウ容量はますます重要になっており、現在のほとんどのモデルは標準で20万トークン以上をサポートしており、長文書や長い会話を中心にアプリケーションを構築する方法を根本的に変えています。
AIコーディングエージェントを使用する開発者にとって、これらの価格差は本番環境展開コストを考慮する際に重要です。データは、GPT-4のような高価格モデルの代替案が、特に大量使用ケースにおいて、大幅に低いコストで同等の性能を提供できることを示唆しています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

OpenClaw クライアントがコスト追跡とエージェントごとの支出制限を追加
新リリースでは、エージェントごとの支出上限、円形プログレスバーを備えたライブ使用状況UI、サブエージェント管理、スキルのオン/オフ切り替え、エージェントごとのモデル選択が追加されました。

APEX MoE Quantsアップデート:新たに25以上のモデルとI-Nanoティアをリリース
APEX の MoE 対応混合精度量子化が、Qwen、Mistral、Gemma、ハイブリッド SSM ファミリーの 30 以上のモデルに拡大。さらに、中間層のエキスパートを 2.06 bpw まで圧縮する新しい I-Nano ティアを追加。

Claude Code v2.1.147:ピン留めセッション、/code-review、および数十の修正
Claude Code v2.1.147 では、ピン留めされたバックグラウンドセッションの導入、/simplify を /code-review に名称変更(努力レベルと --comment を追加)、PowerShell、MCP、Windows などの修正を実施。

AI依存の罠:LLMへの過度な依存が中核スキルを損なう理由
AIチャットボットへの過度の依存が、批判的思考、文章作成、調査、学習能力の衰退につながるという逆張りの主張。