GLM-5.1: 77,8 балла на SWE-bench, производительность как у Claude Opus 4.5

Zhipu AI выпустила GLM-5.1, свою новейшую флагманскую модель, сделав её доступной для всех пользователей Coding Plan. Эта модель демонстрирует способности в программировании, приближающиеся к уровню производительности Claude Opus 4.5.

Ключевые бенчмарки и спецификации

Согласно бенчмаркам за март 2026 года:

SWE-bench-Verified: 77,8 балла — наивысший результат среди моделей с открытым исходным кодом
Terminal Bench 2.0: 56,2 балла — также передовой результат среди моделей с открытым исходным кодом
Превосходит GPT-4o и приближается к Claude Opus 4.5 в задачах программирования

Технические характеристики включают:

Окно контекста: 200K токенов
Максимальный вывод: 128K токенов
744B параметров (40B активировано)
28,5T данных предварительного обучения
Нативная поддержка MCP

Практическое применение

Исходный материал указывает, что эти возможности означают:

Автономное выполнение многоэтапных задач программирования с минимальным вмешательством
Рефакторинг и отладка кодовой базы в длинном контексте
Агентные рабочие процессы: план → выполнение → отладка → поставка

GLM-5.1 уже доступна через тарифные планы Coding Plan от Zhipu AI: Lite, Pro и Max. В обсуждении на Reddit запрашивают сравнения реального тестирования с Claude 4.6 для производственных задач программирования.

📖 Read the full source: r/openclaw

GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5

Ключевые бенчмарки и спецификации

Практическое применение

👀 Смотрите также

Разработка искусственного интеллекта в Uber сталкивается с бюджетными ограничениями, несмотря на инвестиции в размере 3,4 миллиарда долларов.

Исследование Шага 3.5 Flash: открытая модель для быстрого глубокого рассуждения

Документированные проблемы с загрузкой файлов и индексацией в Claude Projects

Трамп отзывает указ об ИИ из-за опасений замедления технологического развития США