Гонка за передовым ИИ закончена: сети малых моделей превосходят централизованный ИИ по стоимости и возможностям

Эндрю Траск утверждает, что централизованные компании ИИ — Fable, Mythos, GPT, Opus — навсегда потеряли передовую позицию. Используя маршрутизированные/взвешенные ансамбли более дешевых моделей, любой теперь может превзойти точность любой отдельной передовой модели с меньшими затратами и более высокой скоростью.
Ключевые выводы из статьи
- Возможности: Дифференциально приватная комбинация передовых моделей на Humanity's Last Exam достигла низких 50 — выше, чем любая отдельная модель. Статья показывает график, где ансамбль GPT и Opus превосходит Fable/Mythos вдвое дешевле.
- Скорость: Независимые рейтинги скорости OpenRouter показывают, что открытые модели быстрее, поскольку хостинг-провайдеры конкурируют по задержке.
- Стоимость: Самый дешевый способ получить производительность уровня Fable/Mythos — это уже не сами эти модели, а ансамбль GPT-5.5 + Opus + Kimi K2.7, который вышел сегодня и превосходит Fable по бенчмаркам.
Схема действий
- Возьмите любую передовую модель ИИ (например, Fable).
- Найдите следующую по качеству более дешевую передовую модель (например, Opus или GPT-5.5).
- Соберите ансамбль из нее, ведущей открытой модели (например, Kimi K2.7) и маршрутизатора.
- Результат: более дешевая и более производительная система, которую можно рекурсивно улучшать бесконечно.
Почему централизованный ИИ не может ответить: эффект Гидры
Траск сравнивает централизованный ИИ с мейнфреймами 1960-х годов. Как только интернет объединил мейнфреймы, сеть всегда оказывалась сильнее. Аналогично, как только вы можете собрать ансамбль из любой комбинации моделей, ни одна отдельная модель никогда не сможет догнать — каждое улучшение отдельной модели только подпитывает ансамбль.
В статье прямо говорится: «Ни одна отдельная передовая система ИИ никогда больше не достигнет передовой позиции из-за того, как работают законы масштабирования/ансамбли». Предсказывается, что будущее за «сетевым ИИ» — сетями нейронных сетей, аналогично эпохе ПК+Интернет.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Стратегия платформы Anthropic и ответ OpenClaw
Разработчик анализирует недавние ограничения Anthropic на внешние интеграции с Claude как преднамеренную платформенную стратегию, утверждая, что следует создавать переносимые стеки вместо того, чтобы полагаться на добрую волю провайдера.

Waymo запускает полностью автономные операции с шестым поколением водителя.
Шестое поколение водителя Waymo начинает полностью автономные операции, предлагая многофункциональный набор сенсоров и современные 17-мегапиксельные камеры.

Стартапы сообщают о больших расходах на вычислительные мощности для ИИ, чем на зарплаты сотрудников.
Стартапы в области ИИ, такие как Swan AI, сообщают о ежемесячных счетах за вычисления ИИ, превышающих 113 тыс. долларов. Генеральные директора описывают это как 'токенмаксинг', когда расходы на ИИ заменяют традиционные бюджеты на персонал.

Agora-1: Многопользовательская модель мира с открытым исходным кодом для симуляции в реальном времени
Odyssey выпускает Agora-1 — мировую модель, которая позволяет до четырём агентам (человек или ИИ) совместно использовать симуляцию в реальном времени, используя GoldenEye в качестве тестовой среды.