inclusionAI发布Ling-2.6-1T:混合架构万亿参数模型,具备稀疏注意力与快速推理能力

Компания inclusionAI открыла исходный код Ling-2.6-1T — флагманской модели с триллионом параметров из семейства Ling, предназначенной для решения сложных реальных задач. Модель представляет гибридную архитектуру, сочетающую Multi-head Latent Attention (MLA) и Linear Attention, что повышает эффективность вывода, снижая задержку и использование VRAM для длинных контекстов, сохраняя при этом выразительность.
Быстрое мышление с помощью стратегии вознаграждения
Пост-обучение использует стратегию вознаграждения Contextual Process Redundancy Suppression, которая стимулирует более короткие и прямые ответы — механизм «быстрого мышления», уменьшающий зависимость от многословных цепочек рассуждений. Это снижает затраты токенов, сохраняя производительность.
SOTA на бенчмарках
Ling-2.6-1T достигает открытого SOTA на бенчмарках, требующих выполнения:
- AIME26 (рассуждение)
- SWE-bench Verified (программная инженерия)
- BFCL-V4 (вызов функций)
- TAU2-Bench (выполнение задач)
- IFBench (следование инструкциям)
Интеграция с агентами
Модель предназначена для сквозных инженерных рабочих процессов — от генерации кода до исправления ошибок — и интегрируется с основными фреймворками агентов, включая Claude Code, OpenClaw, OpenCode и CodeBuddy. Она обрабатывает многоинструментальные и многошаговые ограничения в корпоративных средах.
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Бизнес-стратегия Anthropic: Доходы от API определяют ограничения потребительского уровня
Потребительские подписки Anthropic работают в убыток, субсидируются для создания доли рынка в сфере ИИ, в то время как их API-бизнес приносит доход. Уровень Pro за $20 намеренно ограничен, чтобы направлять пользователей к более ценным подпискам Max.

ИИ Claude восстановил 11-летний биткоин-кошелек на $400 тыс., найдя резервную копию и исправив ошибку брутфорса
Пользователь восстановил кошелек с 5 BTC (стоимостью ~$400K) через 11 лет, скормив все файлы своего студенческого компьютера Claude. ИИ нашел более старую резервную копию кошелька и определил ошибку в логике комбинирования паролей btcrecover, что позволило успешно расшифровать данные.

Стелс-модель Healer Alpha от OpenRouter, по-видимому, является невыпущенным вариантом Qwen 3.5-Omni.
OpenRouter развернул бесплатную анонимную омни-модальную модель под названием Healer Alpha с контекстным окном 262 144 токена и мультимодальными возможностями. Криминалистический анализ предполагает, что это невыпущенный вариант Qwen 3.5-Omni от Alibaba.

Два исследовательских проекта ставят под сомнение имитационное обучение для веб-агентов
Два исследовательских проекта демонстрируют ограничения обучения веб-агентов исключительно на имитации: 'Browser in the Loop' использует обучение с подкреплением с моделью на 8 миллиардов параметров для повышения успешности отправки форм, в то время как 'Concentrate or Collapse' показывает, что стандартное обучение с подкреплением не работает с диффузионными языковыми моделями, требуя оптимизации на уровне последовательностей.