GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5

Zhipu AI выпустила GLM-5.1, свою новейшую флагманскую модель, сделав её доступной для всех пользователей Coding Plan. Эта модель демонстрирует способности в программировании, приближающиеся к уровню производительности Claude Opus 4.5.
Ключевые бенчмарки и спецификации
Согласно бенчмаркам за март 2026 года:
- SWE-bench-Verified: 77,8 балла — наивысший результат среди моделей с открытым исходным кодом
- Terminal Bench 2.0: 56,2 балла — также передовой результат среди моделей с открытым исходным кодом
- Превосходит GPT-4o и приближается к Claude Opus 4.5 в задачах программирования
Технические характеристики включают:
- Окно контекста: 200K токенов
- Максимальный вывод: 128K токенов
- 744B параметров (40B активировано)
- 28,5T данных предварительного обучения
- Нативная поддержка MCP
Практическое применение
Исходный материал указывает, что эти возможности означают:
- Автономное выполнение многоэтапных задач программирования с минимальным вмешательством
- Рефакторинг и отладка кодовой базы в длинном контексте
- Агентные рабочие процессы: план → выполнение → отладка → поставка
GLM-5.1 уже доступна через тарифные планы Coding Plan от Zhipu AI: Lite, Pro и Max. В обсуждении на Reddit запрашивают сравнения реального тестирования с Claude 4.6 для производственных задач программирования.
📖 Read the full source: r/openclaw
👀 Смотрите также

Эффект "Дома с привидениями": пять типов ошибок в коде, созданном искусственным интеллектом
Анализ опыта разработчиков с использованием Claude AI выявляет устойчивую закономерность: первоначальный рост производительности в 10 раз сменяется накоплением технического долга. В источнике определены пять конкретных режимов сбоя, включая скрытые зависимости и паралич контекстного окна.
Бенчмарк усилий рассуждения Opus 4.7: Средний превосходит Высокий и Максимум в реальных задачах
В 29 задачах из репозитория GraphQL-go-tools Opus 4.7 в Claude Code показывает пик при среднем уровне рассуждений — более высокие настройки ухудшают корректность и увеличивают стоимость без улучшения качества патчей.

Кодекс Конверс: Преемник OpenClaw в области автоматизации ИИ
Кодекс теперь может общаться сам с собой, heralding новая эпоха в автоматизации с использованием ИИ и эффективно заменяя OpenClaw, предыдущего лидера.

Мультиагентные системы: Инженерные рабочие процессы против возникающего интеллекта
Анализ разработчика утверждает, что современные мультиагентные системы, такие как LangGraph и рабочие процессы AutoGen, функционируют скорее как микросервисы с оболочками LLM, обеспечивая декомпозицию задач, параллелизацию и модульность, а не истинный эмерджентный интеллект.