SubQ: Первая полностью субквадратичная LLM с 12-миллионным контекстом и 95% точностью RULER

✍️ OpenClawRadar📅 Опубликовано: 5 мая 2026 г.🔗 Source
SubQ: Первая полностью субквадратичная LLM с 12-миллионным контекстом и 95% точностью RULER
Ad

Компания Subquadratic выпустила SubQ 1M-Preview — первую полностью субквадратичную большую языковую модель, где вычислительная сложность линейно масштабируется с длиной контекста (в отличие от квадратичной у трансформеров). Это устраняет необходимость в RAG-системах и обходных путях с разбиением на чанки для задач с длинным контекстом. Исследовательская модель поддерживает до 12 миллионов токенов, а производственная модель на 1 млн токенов доступна в раннем доступе.

Ключевые особенности

  • Субквадратичное внимание: Вычисления внимания сокращены примерно в 1 000 раз по сравнению с передовыми моделями-трансформерами при контексте в 12 млн токенов (по данным источника).
  • SubQ Code: CLI-агент для программирования, который загружает целые кодовые базы в одно окно контекста. Не требуется многоагентная оркестрация — планирует, выполняет и проверяет код по всему репозиторию за один проход.
  • SubQ Search: Инструмент поиска с длинным контекстом, обеспечивающий возможности Deep Research на скорости чат-бота.
  • API: Полноценный API для разработчиков и корпоративных команд.
Ad

Бенчмарки

Все результаты подтверждены третьей стороной (источник не указывает компанию):

  • RULER 128K: точность 95% — по сравнению с Claude Opus 4.6 (94,8%).
  • MRCR v2 (многочастное извлечение и рассуждение): производственная модель — 65,9; исследовательская — 83. Для сравнения: Claude Opus 4.7 = 32,2, GPT 5.5 = 74, Gemini 3.1 Pro = 26,3.
  • SWE-Bench Verified: 81,8% — по сравнению с Opus 4.6 (80,8) и Deepseek 4.0 Pro (80,0).
  • Скорость внимания: SubQ Sparse Attention в 52× быстрее FlashAttention при сравнении на уровне архитектуры, используя на 63% меньше вычислений.

Детали архитектуры

Модель использует принципиально переработанный механизм внимания, построенный с нуля как субквадратичный. Он сочетает идеи линейного внимания, пространственно-состоятельных моделей (state space models) и разреженного внимания — но, в отличие от предыдущих попыток, сохраняет точность на уровне передовых моделей. В команду входят PhD из Meta, Google, Оксфорда, BYU, ByteDance, Adobe и Кембриджа.

Доступность

Частная бета-версия стартует сегодня (5 мая 2026 г.). Доступ к API, SubQ Code CLI и SubQ Search. Оценка SWE-Bench указывает на высокую производительность кодирования для AI-агентов.

📖 Прочитайте полный источник: HN AI Agents

Ad

👀 Смотрите также

Nvidia RTX Spark: 1-петафлопный суперчип приносит локальные ИИ-агенты на ПК с Windows
Новости

Nvidia RTX Spark: 1-петафлопный суперчип приносит локальные ИИ-агенты на ПК с Windows

Nvidia представляет RTX Spark — 1-петафлопсный суперчип для ПК на Windows, обеспечивающий работу локальных ИИ-агентов с поддержкой до 128 ГБ унифицированной памяти и полным стеком CUDA/RTX. Поставки начнутся осенью 2026 года в ноутбуках и десктопах от ASUS, Dell, HP, Lenovo, Microsoft Surface и MSI.

OpenClawRadar
Клод против GPT-4o: один и тот же запрос о двойном маятнике, разные системы координат
Новости

Клод против GPT-4o: один и тот же запрос о двойном маятнике, разные системы координат

Claude и GPT-4o создают визуально разные симуляции двойного маятника, потому что интерпретируют угол θ от противоположных вертикалей — сверху и снизу — при использовании одного и того же рендерера. Математика в обоих случаях корректна, но несоответствие выявляет тонкую неоднозначность интерпретации запроса.

OpenClawRadar
Claude Opus 4.6 блокирует рабочий процесс соревнования Kaggle для проверки кода.
Новости

Claude Opus 4.6 блокирует рабочий процесс соревнования Kaggle для проверки кода.

Разработчик сообщает, что Claude Opus 4.6 теперь блокирует законные рабочие процессы Kaggle-соревнований, где Claude проверяет цепочки рассуждений для валидации данных обучения SFT. Пользователь работал над соревнованием NVIDIA Nemotron Reasoning Challenge, когда фильтры безопасности отметили примеры шифра замены.

OpenClawRadar
NVIDIA анонсирует NemoClaw с функциями безопасности OpenShell.
Новости

NVIDIA анонсирует NemoClaw с функциями безопасности OpenShell.

NVIDIA анонсировала NemoClaw на GTC, развивая OpenClaw для добавления корпоративной безопасности через OpenShell, который обеспечивает политики конфиденциальности и защитные механизмы для ИИ-агентов.

OpenClawRadar