InclusionAI Ling-2.6-1T: 1-Trillion Parameter Hybrid Model

Компания inclusionAI открыла исходный код Ling-2.6-1T — флагманской модели с триллионом параметров из семейства Ling, предназначенной для решения сложных реальных задач. Модель представляет гибридную архитектуру, сочетающую Multi-head Latent Attention (MLA) и Linear Attention, что повышает эффективность вывода, снижая задержку и использование VRAM для длинных контекстов, сохраняя при этом выразительность.

Быстрое мышление с помощью стратегии вознаграждения

Пост-обучение использует стратегию вознаграждения Contextual Process Redundancy Suppression, которая стимулирует более короткие и прямые ответы — механизм «быстрого мышления», уменьшающий зависимость от многословных цепочек рассуждений. Это снижает затраты токенов, сохраняя производительность.

SOTA на бенчмарках

Ling-2.6-1T достигает открытого SOTA на бенчмарках, требующих выполнения:

AIME26 (рассуждение)
SWE-bench Verified (программная инженерия)
BFCL-V4 (вызов функций)
TAU2-Bench (выполнение задач)
IFBench (следование инструкциям)

Интеграция с агентами

Модель предназначена для сквозных инженерных рабочих процессов — от генерации кода до исправления ошибок — и интегрируется с основными фреймворками агентов, включая Claude Code, OpenClaw, OpenCode и CodeBuddy. Она обрабатывает многоинструментальные и многошаговые ограничения в корпоративных средах.

📖 Читать полный источник: r/LocalLLaMA

inclusionAI发布Ling-2.6-1T：混合架构万亿参数模型，具备稀疏注意力与快速推理能力

Быстрое мышление с помощью стратегии вознаграждения

SOTA на бенчмарках

Интеграция с агентами

👀 Смотрите также

Бизнес-стратегия Anthropic: Доходы от API определяют ограничения потребительского уровня

ИИ Claude восстановил 11-летний биткоин-кошелек на $400 тыс., найдя резервную копию и исправив ошибку брутфорса

Стелс-модель Healer Alpha от OpenRouter, по-видимому, является невыпущенным вариантом Qwen 3.5-Omni.

Два исследовательских проекта ставят под сомнение имитационное обучение для веб-агентов