GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5

✍️ OpenClawRadar📅 Опубликовано: 27 марта 2026 г.🔗 Source
GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5
Ad

Zhipu AI выпустила GLM-5.1, свою новейшую флагманскую модель, сделав её доступной для всех пользователей Coding Plan. Эта модель демонстрирует способности в программировании, приближающиеся к уровню производительности Claude Opus 4.5.

Ключевые бенчмарки и спецификации

Согласно бенчмаркам за март 2026 года:

  • SWE-bench-Verified: 77,8 балла — наивысший результат среди моделей с открытым исходным кодом
  • Terminal Bench 2.0: 56,2 балла — также передовой результат среди моделей с открытым исходным кодом
  • Превосходит GPT-4o и приближается к Claude Opus 4.5 в задачах программирования

Технические характеристики включают:

  • Окно контекста: 200K токенов
  • Максимальный вывод: 128K токенов
  • 744B параметров (40B активировано)
  • 28,5T данных предварительного обучения
  • Нативная поддержка MCP
Ad

Практическое применение

Исходный материал указывает, что эти возможности означают:

  • Автономное выполнение многоэтапных задач программирования с минимальным вмешательством
  • Рефакторинг и отладка кодовой базы в длинном контексте
  • Агентные рабочие процессы: план → выполнение → отладка → поставка

GLM-5.1 уже доступна через тарифные планы Coding Plan от Zhipu AI: Lite, Pro и Max. В обсуждении на Reddit запрашивают сравнения реального тестирования с Claude 4.6 для производственных задач программирования.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Эффект "Дома с привидениями": пять типов ошибок в коде, созданном искусственным интеллектом
Новости

Эффект "Дома с привидениями": пять типов ошибок в коде, созданном искусственным интеллектом

Анализ опыта разработчиков с использованием Claude AI выявляет устойчивую закономерность: первоначальный рост производительности в 10 раз сменяется накоплением технического долга. В источнике определены пять конкретных режимов сбоя, включая скрытые зависимости и паралич контекстного окна.

OpenClawRadar
🦀
Новости

Бенчмарк усилий рассуждения Opus 4.7: Средний превосходит Высокий и Максимум в реальных задачах

В 29 задачах из репозитория GraphQL-go-tools Opus 4.7 в Claude Code показывает пик при среднем уровне рассуждений — более высокие настройки ухудшают корректность и увеличивают стоимость без улучшения качества патчей.

OpenClawRadar
Кодекс Конверс: Преемник OpenClaw в области автоматизации ИИ
Новости

Кодекс Конверс: Преемник OpenClaw в области автоматизации ИИ

Кодекс теперь может общаться сам с собой, heralding новая эпоха в автоматизации с использованием ИИ и эффективно заменяя OpenClaw, предыдущего лидера.

OpenClawRadar
Мультиагентные системы: Инженерные рабочие процессы против возникающего интеллекта
Новости

Мультиагентные системы: Инженерные рабочие процессы против возникающего интеллекта

Анализ разработчика утверждает, что современные мультиагентные системы, такие как LangGraph и рабочие процессы AutoGen, функционируют скорее как микросервисы с оболочками LLM, обеспечивая декомпозицию задач, параллелизацию и модульность, а не истинный эмерджентный интеллект.

OpenClawRadar