Сети небольших моделей ИИ обходят лидеров по скорости и цене

Эндрю Траск утверждает, что централизованные компании ИИ — Fable, Mythos, GPT, Opus — навсегда потеряли передовую позицию. Используя маршрутизированные/взвешенные ансамбли более дешевых моделей, любой теперь может превзойти точность любой отдельной передовой модели с меньшими затратами и более высокой скоростью.

Ключевые выводы из статьи

Возможности: Дифференциально приватная комбинация передовых моделей на Humanity's Last Exam достигла низких 50 — выше, чем любая отдельная модель. Статья показывает график, где ансамбль GPT и Opus превосходит Fable/Mythos вдвое дешевле.
Скорость: Независимые рейтинги скорости OpenRouter показывают, что открытые модели быстрее, поскольку хостинг-провайдеры конкурируют по задержке.
Стоимость: Самый дешевый способ получить производительность уровня Fable/Mythos — это уже не сами эти модели, а ансамбль GPT-5.5 + Opus + Kimi K2.7, который вышел сегодня и превосходит Fable по бенчмаркам.

Схема действий

Возьмите любую передовую модель ИИ (например, Fable).
Найдите следующую по качеству более дешевую передовую модель (например, Opus или GPT-5.5).
Соберите ансамбль из нее, ведущей открытой модели (например, Kimi K2.7) и маршрутизатора.
Результат: более дешевая и более производительная система, которую можно рекурсивно улучшать бесконечно.

Почему централизованный ИИ не может ответить: эффект Гидры

Траск сравнивает централизованный ИИ с мейнфреймами 1960-х годов. Как только интернет объединил мейнфреймы, сеть всегда оказывалась сильнее. Аналогично, как только вы можете собрать ансамбль из любой комбинации моделей, ни одна отдельная модель никогда не сможет догнать — каждое улучшение отдельной модели только подпитывает ансамбль.

В статье прямо говорится: «Ни одна отдельная передовая система ИИ никогда больше не достигнет передовой позиции из-за того, как работают законы масштабирования/ансамбли». Предсказывается, что будущее за «сетевым ИИ» — сетями нейронных сетей, аналогично эпохе ПК+Интернет.

📖 Читать полный источник: HN AI Agents

Гонка за передовым ИИ закончена: сети малых моделей превосходят централизованный ИИ по стоимости и возможностям

Ключевые выводы из статьи

Схема действий

Почему централизованный ИИ не может ответить: эффект Гидры

👀 Смотрите также

Стратегия платформы Anthropic и ответ OpenClaw

Waymo запускает полностью автономные операции с шестым поколением водителя.

Стартапы сообщают о больших расходах на вычислительные мощности для ИИ, чем на зарплаты сотрудников.

Agora-1: Многопользовательская модель мира с открытым исходным кодом для симуляции в реальном времени