Kimi K2.7-Code: Модель с открытым исходным кодом для кодирования с лучшей эффективностью токенов

Moonshot AI выпустила Kimi K2.7-Code, открытую модель для кодинга, доступную на Hugging Face в пространстве имён moonshotai/Kimi-K2.7-Code. Модель помечена тегом image-text-to-text и использует библиотеку Transformers. Она позиционируется как токен-эффективная альтернатива для задач генерации и понимания кода.
Ключевые особенности
- Провайдеры инференса: Novita предлагает модель с индикатором активности, поддержкой вызова инструментов (
toolCalling: true), структурированный вывод пока недоступен. Пропускная способность — 36,1 токен/сек. - Архитектура модели: Модель состоит из 64 шардов (формат safetensors:
model-00001-of-000064.safetensors). - Токен-эффективность: Модель использует собственный чат-шаблон, который сохраняет содержимое рассуждений (
preserve_thinking: true) и оптимизирует использование токенов за счёт разделения сообщений истории и суффикса. Шаблон включает специальные токены, такие как<|im_user|>,<|im_assistant|>и<|im_system|>для управления ролями, а также блоки<think>/</think>для инкапсуляции цепочек рассуждений. - Вызов инструментов: Нативная поддержка вызова инструментов с форматированием структурированных аргументов с использованием маркеров
<|tool_call_begin|>и<|tool_call_end|>. - Вовлечённость сообщества: 334 лайка на Hugging Face, 4 комментария и 41 балл на Hacker News на момент публикации.
Практическое применение
Дизайн шаблона явно избегает встраивания токенов рассуждений в историю, когда preserve_thinking отключён, что снижает накладные расходы контекста. Для разработчиков, использующих ИИ-агенты для кодинга, это означает меньшее потребление токенов на взаимодействие — особенно полезно в длинных агентных циклах, где цепочки рассуждений повторяются. Формат вызова инструментов совместим с JSON, что упрощает интеграцию с существующими конвейерами вызова функций.
Модель доступна для немедленного использования через Novita, а репозиторий на Hugging Face содержит полную конфигурацию токенизатора и исходный код шаблона.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Результаты AIME 2026: открытые и закрытые модели набирают выше 90%
ИИ-модели достигают 90%+ на AIME 2026, при этом DeepSeek V3.2 проходит весь тест всего за bash.09.

Янн ЛеКун привлек $1 млрд для разработки AI-мировых моделей через AMI, бросая вызов подходу на основе больших языковых моделей (LLM).
Стартап Янна Лекуна AMI привлёк более $1 млрд для разработки ИИ-моделей мира, понимающих физический мир, утверждая, что одних лишь больших языковых моделей недостаточно для достижения человеческого уровня интеллекта. Компания создаст системы с постоянной памятью, способностью к рассуждению и планированию для применения в производстве, биомедицине и робототехнике.

SubQ: Первая полностью субквадратичная LLM с 12-миллионным контекстом и 95% точностью RULER
Subquadratic запускает SubQ 1M-Preview — субквадратичную LLM с линейным масштабированием вычислений, контекстом в 12 млн токенов, разреженным вниманием в 52× быстрее FlashAttention и точностью 95% на RULER 128K. Доступна через API, CLI код-агент (SubQ Code) и поисковый инструмент (SubQ Search).

Стартап по ИИ Янна Лекуна привлек $1 млрд в крупнейшем раунде начального финансирования в Европе.
Стартап в области ИИ Янна Лекуна привлёк 1 миллиард долларов в рамках крупнейшего в Европе раунда посевного финансирования. Новость была опубликована на Hacker News, набрав 186 баллов и 107 комментариев.