inclusionAI发布Ling-2.6-1T:混合架构万亿参数模型,具备稀疏注意力与快速推理能力

Компания inclusionAI открыла исходный код Ling-2.6-1T — флагманской модели с триллионом параметров из семейства Ling, предназначенной для решения сложных реальных задач. Модель представляет гибридную архитектуру, сочетающую Multi-head Latent Attention (MLA) и Linear Attention, что повышает эффективность вывода, снижая задержку и использование VRAM для длинных контекстов, сохраняя при этом выразительность.
Быстрое мышление с помощью стратегии вознаграждения
Пост-обучение использует стратегию вознаграждения Contextual Process Redundancy Suppression, которая стимулирует более короткие и прямые ответы — механизм «быстрого мышления», уменьшающий зависимость от многословных цепочек рассуждений. Это снижает затраты токенов, сохраняя производительность.
SOTA на бенчмарках
Ling-2.6-1T достигает открытого SOTA на бенчмарках, требующих выполнения:
- AIME26 (рассуждение)
- SWE-bench Verified (программная инженерия)
- BFCL-V4 (вызов функций)
- TAU2-Bench (выполнение задач)
- IFBench (следование инструкциям)
Интеграция с агентами
Модель предназначена для сквозных инженерных рабочих процессов — от генерации кода до исправления ошибок — и интегрируется с основными фреймворками агентов, включая Claude Code, OpenClaw, OpenCode и CodeBuddy. Она обрабатывает многоинструментальные и многошаговые ограничения в корпоративных средах.
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Claude Code v2.1.68: В Opus 4.6 по умолчанию установлено среднее усилие, возвращено ключевое слово ultrathink.
В версии Claude Code v2.1.68 изменён уровень усилий по умолчанию для модели Opus 4.6 на средний для подписчиков Max и Team, возвращено ключевое слово 'ultrathink' для высоких усилий, а также удалены старые модели Opus 4 и 4.1 из основного API.

Отчет Стэнфорда показывает расхождение во взглядах на влияние ИИ между экспертами и общественностью.
Ежегодный отраслевой отчёт Стэнфорда по ИИ выявляет значительный разрыв между оптимизмом экспертов и общественной тревогой: эксперты сосредоточены на рисках ИИ общего назначения, а общественность беспокоится о рабочих местах, медицинском обслуживании и стоимости коммунальных услуг.

OpenClaw Client добавляет отслеживание затрат и лимиты расходов на агента
Новый релиз добавляет ограничения расходов на агента, пользовательский интерфейс использования в реальном времени с круговым индикатором прогресса, управление под-агентами, переключение навыков и выбор модели для каждого агента.

Отчет Anthropic об интенсивности внедрения искусственного интеллекта в мире
Последние данные Anthropic показывают неравномерное внедрение ИИ в мире, измеряя интенсивность использования, а не общее количество пользователей. Отчёт демонстрирует, где ИИ интегрирован в рабочие процессы, такие как программирование, исследования и принятие решений, как среди частных лиц, так и в бизнесе.