GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5

✍️ OpenClawRadar📅 Опубликовано: 27 марта 2026 г.🔗 Source
GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5
Ad

Zhipu AI выпустила GLM-5.1, свою новейшую флагманскую модель, сделав её доступной для всех пользователей Coding Plan. Эта модель демонстрирует способности в программировании, приближающиеся к уровню производительности Claude Opus 4.5.

Ключевые бенчмарки и спецификации

Согласно бенчмаркам за март 2026 года:

  • SWE-bench-Verified: 77,8 балла — наивысший результат среди моделей с открытым исходным кодом
  • Terminal Bench 2.0: 56,2 балла — также передовой результат среди моделей с открытым исходным кодом
  • Превосходит GPT-4o и приближается к Claude Opus 4.5 в задачах программирования

Технические характеристики включают:

  • Окно контекста: 200K токенов
  • Максимальный вывод: 128K токенов
  • 744B параметров (40B активировано)
  • 28,5T данных предварительного обучения
  • Нативная поддержка MCP
Ad

Практическое применение

Исходный материал указывает, что эти возможности означают:

  • Автономное выполнение многоэтапных задач программирования с минимальным вмешательством
  • Рефакторинг и отладка кодовой базы в длинном контексте
  • Агентные рабочие процессы: план → выполнение → отладка → поставка

GLM-5.1 уже доступна через тарифные планы Coding Plan от Zhipu AI: Lite, Pro и Max. В обсуждении на Reddit запрашивают сравнения реального тестирования с Claude 4.6 для производственных задач программирования.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Встреча OpenClaw в Пекине собрала полный зал технических специалистов.
Новости

Встреча OpenClaw в Пекине собрала полный зал технических специалистов.

На митапе OpenClaw в Пекине был аншлаг, разработчики задавали подробные вопросы о мультиагентной оркестровке, автономных циклах и приватных развертываниях. Особый интерес вызвала демонстрация, где агенты Планировщик, Разработчик и Верификатор автономно сотрудничали, чтобы обеспечить работу компании одного человека.

OpenClawRadar
Anthropic переносит фоновую автоматизацию Claude Code в отдельный кредитный пакет SDK, нарушая работу агентов
Новости

Anthropic переносит фоновую автоматизацию Claude Code в отдельный кредитный пакет SDK, нарушая работу агентов

Начиная с 15 июня, claude -p, использование Agent SDK, Claude Code GitHub Actions и сторонние приложения Agent SDK больше не будут учитываться в интерактивных квотах Pro/Max. Применяется новый отдельный кредитный пул Agent SDK: $100 в месяц для планов Max 5x. Фоновые стеки агентов (например, тикеты → агенты → хуки → исполнитель → claude -p) быстро исчерпают этот лимит.

OpenClawRadar
Клод Безопасность публичная бета: сканирует кодовую базу, проверяет собственные выводы, предлагает исправления
Новости

Клод Безопасность публичная бета: сканирует кодовую базу, проверяет собственные выводы, предлагает исправления

Anthropic запустила Claude Security в публичной бета-версии для корпоративных клиентов. Инструмент анализирует код как исследователь безопасности, оспаривает собственные находки через adversarial-самопроверку и предлагает конкретные исправления.

OpenClawRadar
Эволюция архитектуры KV-кэша: от GPT-2 до Mamba
Новости

Эволюция архитектуры KV-кэша: от GPT-2 до Mamba

Анализ затрат памяти на KV-кэш показывает, что GPT-2 использовал 300 КБайт/токен, Llama 3 сократил этот показатель до 128 КБайт/токен с помощью группового запросного внимания, а DeepSeek V3 достиг 68,6 КБайт/токен с использованием многоголового латентного внимания. Mamba/SSM полностью устраняют KV-кэш за счёт фиксированного размера скрытых состояний.

OpenClawRadar