SubQ: Субквадратичная языковая модель с контекстным окном в 12 миллионов токенов

SubQ от Subquadratic — это готовая к продакшну LLM, построенная на полностью субквадратичной архитектуре разреженного внимания. Она обрабатывает до 12 млн токенов в одном запросе, работает со скоростью 150 токенов в секунду и стоит примерно в 5 раз меньше ведущих моделей, таких как GPT-5 или Opus.
Архитектура и бенчмарки
В отличие от стандартных трансформеров с attention сложности O(n²), SubQ использует механизм разреженного внимания субквадратичной сложности, который обрабатывает только релевантные связи между токенами. При 12 млн токенов это снижает вычислительные затраты на attention почти в 1000 раз. Бенчмарки (сторонняя валидация):
- SWE-Bench Verified (реальное программирование): 81.8%
- RULER @ 128K (точность на длинных контекстах): 95.0%
- MRCR v2 (8 иголок, 1M): 65.9%
Для сравнения, результат SubQ в SWE-Bench находится между Gemini 3.1 Pro (80.6%) и Opus 4.6 (80.8%). Модель также превосходит Opus 4.7 (87.6%? — не сообщалось на тот момент) и GPT-5.5 (н/д) в MRCR v2.
Продукты и интеграция
Два варианта доступа:
- Full-Context API: контекст 12 млн токенов, стриминг, использование инструментов, конечные точки, совместимые с OpenAI. Обрабатывайте целые репозитории за один вызов с линейной стоимостью.
- SubQ Code (слой длинного контекста для кодинговых агентов): Подключается к Claude Code, Codex или Cursor. Примерно на 25% ниже счет, в 10 раз быстрее исследование, автоматическое перенаправление дорогих вызовов моделей. Установка в одну строку.
Для кого это
Для разработчиков и команд, управляющих AI-агентами, которым требуется рассуждать о целых кодовых базах, длинных историях PR или постоянном состоянии без потери качества.
📖 Прочитать полный источник: HN AI Agents
👀 Смотрите также

Запуск Альфреда Бета: Упрощённая альтернатива OpenClaw для нетехнических пользователей
Alfred — это новый бета-инструмент, который предоставляет примерно 70% функциональности OpenClaw при значительно меньшей сложности, предлагая простые настройки по умолчанию для подключения приложений, памяти, режимов использования и инфраструктуры, а также позволяя кастомизацию.

Проблемы в рабочем процессе OpenClaw с несколькими агентами: Зависания, потеря контекста и неэффективное использование токенов
Разработчик сообщает, что многозадачные рабочие процессы OpenClaw часто зависают с бездействующими агентами, наблюдается утечка контекста, несмотря на пользовательскую документацию, и потребляется чрезмерное количество токенов без вывода результатов. В настройке использовались модели Gemini 3 Pro/Codex с оркестратором COO и специализированными агентами задач.

Claude IDE Bridge: инструмент с открытым исходным кодом, который предоставляет ИИ Claude прямой доступ к вашему редактору кода
Claude IDE Bridge — это инструмент с открытым исходным кодом и лицензией MIT, который напрямую подключает Claude AI к вашему редактору кода, позволяя ему видеть открытые файлы, несохранённые изменения и ошибки в реальном времени, а не через вставленные фрагменты кода. В настоящее время инструмент работает с VS Code и Windsurf.

cstat: Нативный статус-бар на Rust для Claude Code с производительностью 2 мс
cstat — это нативный бинарный файл на Rust, который заменяет строку состояния claude-hud с 62 мс на реализацию за 2 мс, исключая 24 запуска подпроцессов за вызов. Он отображает информацию о модели, ограничения скорости, статус git, использование контекстного окна, активные инструменты, под-агентов и прогресс задач.