GLM-5.1 выпущен с производительностью в кодировании на уровне Claude Opus 4.5

Zhipu AI выпустила GLM-5.1, свою новейшую флагманскую модель, сделав её доступной для всех пользователей Coding Plan. Эта модель демонстрирует способности в программировании, приближающиеся к уровню производительности Claude Opus 4.5.
Ключевые бенчмарки и спецификации
Согласно бенчмаркам за март 2026 года:
- SWE-bench-Verified: 77,8 балла — наивысший результат среди моделей с открытым исходным кодом
- Terminal Bench 2.0: 56,2 балла — также передовой результат среди моделей с открытым исходным кодом
- Превосходит GPT-4o и приближается к Claude Opus 4.5 в задачах программирования
Технические характеристики включают:
- Окно контекста: 200K токенов
- Максимальный вывод: 128K токенов
- 744B параметров (40B активировано)
- 28,5T данных предварительного обучения
- Нативная поддержка MCP
Практическое применение
Исходный материал указывает, что эти возможности означают:
- Автономное выполнение многоэтапных задач программирования с минимальным вмешательством
- Рефакторинг и отладка кодовой базы в длинном контексте
- Агентные рабочие процессы: план → выполнение → отладка → поставка
GLM-5.1 уже доступна через тарифные планы Coding Plan от Zhipu AI: Lite, Pro и Max. В обсуждении на Reddit запрашивают сравнения реального тестирования с Claude 4.6 для производственных задач программирования.
📖 Read the full source: r/openclaw
👀 Смотрите также

Встреча OpenClaw в Пекине собрала полный зал технических специалистов.
На митапе OpenClaw в Пекине был аншлаг, разработчики задавали подробные вопросы о мультиагентной оркестровке, автономных циклах и приватных развертываниях. Особый интерес вызвала демонстрация, где агенты Планировщик, Разработчик и Верификатор автономно сотрудничали, чтобы обеспечить работу компании одного человека.

Anthropic переносит фоновую автоматизацию Claude Code в отдельный кредитный пакет SDK, нарушая работу агентов
Начиная с 15 июня, claude -p, использование Agent SDK, Claude Code GitHub Actions и сторонние приложения Agent SDK больше не будут учитываться в интерактивных квотах Pro/Max. Применяется новый отдельный кредитный пул Agent SDK: $100 в месяц для планов Max 5x. Фоновые стеки агентов (например, тикеты → агенты → хуки → исполнитель → claude -p) быстро исчерпают этот лимит.

Клод Безопасность публичная бета: сканирует кодовую базу, проверяет собственные выводы, предлагает исправления
Anthropic запустила Claude Security в публичной бета-версии для корпоративных клиентов. Инструмент анализирует код как исследователь безопасности, оспаривает собственные находки через adversarial-самопроверку и предлагает конкретные исправления.

Эволюция архитектуры KV-кэша: от GPT-2 до Mamba
Анализ затрат памяти на KV-кэш показывает, что GPT-2 использовал 300 КБайт/токен, Llama 3 сократил этот показатель до 128 КБайт/токен с помощью группового запросного внимания, а DeepSeek V3 достиг 68,6 КБайт/токен с использованием многоголового латентного внимания. Mamba/SSM полностью устраняют KV-кэш за счёт фиксированного размера скрытых состояний.