GLM-5.1がリリースされ、コーディング性能がClaude Opus 4.5に匹敵

Zhipu AIは、最新のフラッグシップモデルであるGLM-5.1をリリースし、すべてのCoding Planユーザーが利用できるようにしました。このモデルは、Claude Opus 4.5の性能レベルに迫るコーディング能力を示しています。
主要なベンチマークと仕様
2026年3月のベンチマークによると:
- SWE-bench-Verified: 77.8ポイント — オープンソースモデルの中で最高スコア
- Terminal Bench 2.0: 56.2ポイント — オープンソースの最先端技術
- コーディングタスクにおいてGPT-4oを上回り、Claude Opus 4.5に接近
技術仕様は以下の通りです:
- 200Kコンテキストウィンドウ
- 128K最大出力
- 744Bパラメータ(40Bアクティブ)
- 28.5Tの事前学習データ
- ネイティブMCPサポート
実用的な応用
ソース資料によると、これらの能力は以下のことに活用できます:
- 最小限の手助けで自律的な多段階コーディングタスクを実行
- 長いコンテキストのコードベースのリファクタリングとデバッグ
- エージェント型ワークフロー:計画 → 実行 → デバッグ → 納品
GLM-5.1は、Zhipu AIのCoding Plan(Lite、Pro、Max)を通じて利用可能です。Redditの議論では、実稼働コーディングタスクにおけるClaude 4.6との実世界でのテスト比較が求められています。
📖 Read the full source: r/openclaw
👀 See Also

ヤン・ルカンのAIスタートアップ、欧州最大のシードラウンドで10億ドルを調達
ヤン・ルカンのAIスタートアップが10億ドルを調達し、欧州最大のシードラウンドと報じられています。このニュースはHacker Newsで186ポイント、107コメントを集めて共有されました。

AIインフラに潜む金融バブル – 重要なポイント
AIインフラ支出ブームに対する批判的分析であり、過去のテクノロジー暴落と同様の持続不可能なバブルを警告する。このPDFは、GPUやデータセンターへの巨額の設備投資が実際の収益をはるかに上回っていると論じている。

GitHub Copilot 個人プランの変更: 新規申し込み一時停止、制限強化、モデル調整
GitHubは、エージェント型ワークフローによる計算需要の増加に対応するため、Copilot Pro、Pro+、およびStudentプランの新規申し込みを一時停止し、使用制限を厳格化、さらにProプランからOpusモデルを削除しています。

開発者から見たAI不安と「AI精神病」への視点
Redditの議論から、AIツールを使用する開発者の間で広がる不安が明らかになりました。年齢層によって異なるプレッシャーを経験しています:35〜45歳は常に再発明のプレッシャーを感じ、25〜35歳はスキルが時代遅れになることを心配し、25歳未満の開発者はAIに精通しているにもかかわらずバーンアウトのリスクに直面しています。