OpenClawモデル性能レビュー:Codex 5.3が首位、GLMモデルは期待外れ

OpenClawにおけるモデルパフォーマンスランキング
開発者が複数のAIモデルをOpenClawでテストし、詳細なパフォーマンス観察結果を共有しました。テストはCodex、Google、Sonnet、Gemini、DeepSeek、Z.aiのGLMモデルを対象とし、ベンチマークではなく実用的な使用体験に焦点を当てています。
最高パフォーマンスモデル
- Codex 5.3 - 評価9/10。開発者のお気に入りモデルで、OpenClaw用に改良されたチャットエージェント機能を備えている可能性があります。ユーザーの意図をよく理解し、一貫して望ましい出力を提供し、中断やバグが最小限です。
- Sonnet 4.6 - 評価8/10。速度と問題解決能力から2番目のお気に入りです。Codex 5.3が利用できない場合に十分な体験を提供し、日常使用に適しています。
- DeepSeek 3.2 Agent - 評価7/10。OpenClaw用に明確にカスタマイズされており、ネイティブエージェントと作業しているような感覚です。Sonnet、Opus、Codexほどコーディング能力は強くありませんが、日常使用のための堅実な代替手段です。中国製代替モデルとしてAPI料金が高い可能性が指摘されています。
中位層モデル
- Google 3.1 Pro(LowおよびHigh) - 評価6/10。antigravity認証でテストされました。OpenClawとの相互作用が弱く、パフォーマンスが遅く、継続的な使用には魅力的ではありません。SonnetとCodexが利用できない場合のみ検討するとしています。
期待外れのパフォーマー
- GLM 4.7 - 評価5/10。安価なAPI料金とプロアカウントでのCodexの3-4倍のクォータを特徴とするSonnet代替品として販売されています。しかし、常に動作が停止し、返信が遅く、メール確認のような単純なタスクでも出力長が一貫しません。新しいセッションでわずか5通のメールを確認するために100万トークンを消費しました。
- GLM 5 - 評価5/10。ベンチマークではOpusやCodex 5.3と競合すると主張されていますが、OpenClawでの体験は一致しません。同じタスクに2-3倍のトークンを使用し、返信が遅く、コーディング回答はSonnet 4.5レベルです。OpenClawに特化した最適化が必要です。主な利点は価格です。
- Gemini 3 Flash - 評価4/10。非常に単純なタスクにのみ適しており、本格的な使用には推奨されません。
開発者は、OpenClawが最適化されていないか、モデルの品質問題による体験の明らかな違いから、適切なモデルを選択することが難しいと指摘しました。Codex以外の多様化を望みながらもGLMモデルに失望を表明し、将来的な改善を期待しています。
📖 Read the full source: r/openclaw
👀 See Also

シェルに組み込まれたAIエージェント:ターミナルバッファ&オーバーレイ拡張
端末出力を読み取り、フローティングオーバーレイを介してコマンドを入力するAIエージェントを組み込んだオープンソースシェル。ローカルモデルとクラウドモデルに対応。

OpenLobster:Go言語で書かれたセルフホスト型AIエージェント、30MBのRAM使用量
OpenLobsterは、Goで書かれたセルフホスト型AIアシスタントで、シングルバイナリとして動作し、30MBのRAM使用量と200msのコールドスタートを実現しています。Ollama、OpenRouter、およびあらゆるOpenAI互換エンドポイントを含む複数のLLMプロバイダーをサポートし、メモリはグラフデータベースに保存されます。

Codesight CLIは、コードベースをスキャンすることでAIコーディングエージェントのトークン使用量を削減します。
Codesightは依存関係ゼロのCLIツールで、TypeScript、Python、Goプロジェクトをスキャンしてコンパクトなコンテキストファイルを生成し、実際のプロダクションコードベースのベンチマークによると、Claude Codeの探索トークンを平均12.3倍削減します。

Claudeスキルハブ:789以上のClaudeコードスキルと10の自律エージェントの検索可能リポジトリ
Claude Skills Hub (clskills.in) は、71カテゴリにわたる789以上のClaude Codeスキルファイルと、複数のスキルを連鎖させて完全なワークフローを構築する10の自律型AIエージェントを提供する、一元化された検索インターフェースです。このオープンソースプロジェクトは、複数のコミュニティコレクションからスキルを集約し、ワンクリックダウンロードを提供します。