ピンチベンチ結果：初のOpenClaw専用AIコーディングエージェントベンチマーク

✍️ OpenClawRadar📅 公開日: March 8, 2026🔗 Source

ピンチベンチ結果：初のOpenClaw専用AIコーディングエージェントベンチマーク

Ad

PinchBenchは、OpenClawエコシステムにおけるAIコーディングエージェントの評価のために特別に設計された最初のベンチマークであり、成功率、コスト、速度でモデルをランク付けしています。

主な結果

このベンチマークでは32のモデルがテストされました。成功率による上位パフォーマーは以下の通りです：

1. google/gemini-3-flash-preview: 95.1%の成功率、0.72ドルのコスト、254.50秒の速度
2. minimax/minimax-m2.1: 93.6%の成功率、0.14ドルのコスト、239.79秒の速度
3. moonshotai/kimi-k2.5: 93.4%の成功率、0.20ドルのコスト、291.67秒の速度
4. anthropic/claude-sonnet-4.5: 92.7%の成功率、3.07ドルのコスト、304.53秒の速度
5. google/gemini-3-pro-preview: 91.7%の成功率、1.48ドルのコスト、239.55秒の速度

注目すべき発見

FlashモデルはProモデルを低コストで上回る：Gemini-3-Flash-Preview（95.1%、0.72ドル）はGemini-3-Pro-Preview（91.7%、1.48ドル）を凌駕
高価なモデルが必ずしも優れたパフォーマンスを示すわけではない
Minimax 2.5は35.5%の成功率、105.96秒の速度で31位（コストは記載なし）
複数のモデルが90%以上の高い成功率を維持しながら、1ドル未満のコストを実現

パフォーマンス範囲

成功率は95.1%（最高）から35.2%（最低）の範囲にあります。コスト効率の良い選択肢には以下が含まれます：

openai/gpt-5-nano: 85.8%の成功率で0.03ドル
google/gemini-2.5-flash-lite: 83.2%の成功率で0.05ドル
mistralai/devstral-2512: 81.7%の成功率で0.10ドル

ランキングの下位（23-32位）の複数のモデルは、約40%以下の成功率を示しており、提供されたデータにはコストが記載されていません。

📖 完全なソースを読む： r/openclaw

Ad

👀 See Also

Claude Toolbox拡張機能にメッセージレベルのブックマークと全文検索が追加

Claude Toolbox拡張機能にメッセージレベルのブックマークと全文検索が追加

Claude ToolboxはChrome拡張機能で、個別のメッセージをブックマークしたり、会話全体を全文検索したり、TXTやJSONでエクスポートできます。無料枠では2件の会話まで対応。有料版は月額5ドルまたは49ドルの永続ライセンスです。

May 10, 2026, 10:20 AM UTC

Claude AIの使用制限を監視する無料macOSメニューバーアプリ

Claude AIの使用制限を監視する無料macOSメニューバーアプリ

Claude AIのセッション使用率、週間制限、リセットカウントダウンをメニューバーに直接表示する、無料でオープンソースのmacOSツールです。Homebrewコマンド1つでインストールでき、既存のChromeセッションを利用してデータを保存しません。

Apr 14, 2026, 01:45 PM UTC

Claude CodeがNVIDIA NIMゲートウェイ経由で240以上のモデルをサポート — エージェンティックコーディング向けNemotron-3 120Bを含む

Claude CodeがNVIDIA NIMゲートウェイ経由で240以上のモデルをサポート — エージェンティックコーディング向けNemotron-3 120Bを含む

Claude Code は、/model コマンドでセッション中に 240 以上の NVIDIA NIM モデルに切り替え可能。Nemotron-3 Super 120B 思考型バリアントは、複数ファイルのリファクタリングやエージェントタスクで強力な結果を示している。

May 19, 2026, 06:19 PM UTC

Claude Code公式Telegramプラグイン：セットアップノートとOpenClawからの移行

Claude Code公式Telegramプラグイン：セットアップノートとOpenClawからの移行

ある開発者がOpenClawからClaude Codeの公式Telegram連携に移行し、セットアップ手順を文書化し、オープンソースの移行スキルを作成しました。この連携はBotFatherトークンを介して接続し、より優れたトークン効率とクリーンなコミュニケーションを提供します。

Apr 16, 2026, 11:45 AM UTC