Предложение по адаптивному маршрутизированию вывода для повышения эффективности обработки AI-запросов

Что это такое
Техническое предложение, представленное команде по продуктам и разработке Anthropic в апреле 2026 года, для автоматической маршрутизации запросов ИИ к соответствующим уровням моделей на основе оценки сложности до начала дорогостоящих вычислений.
Проблема
В настоящее время каждый запрос, отправленный Claude — от простых вопросов вроде «сколько варить яйцо» до технических промптов на 2000 слов — по умолчанию направляется к модели с полными возможностями. Система не оценивает сложность до выделения вычислительных ресурсов, что неэффективно в масштабе. Вывод ИИ — самый быстрорастущий компонент энергопотребления дата-центров, прогнозируется, что к 2028 году он достигнет 12% от потребления электроэнергии в США.
Предлагаемое решение: пятиэтапный процесс
- Шаг 1 — Подсчёт: Измерение длины запроса в символах, количества предложений и наличия вложений или многосоставных инструкций
- Шаг 2 — Сортировка: Маршрутизация к уровню модели на основе оценки сложности. Одиночные короткие предложения по умолчанию направляются к облегчённым моделям; многоабзацные промпты с контекстом направляются к более мощным моделям
- Шаг 3 — Чтение: Назначенная модель обрабатывает запрос в обычном режиме
- Шаг 4 — Ответ: Ответ возвращается пользователю
- Шаг 5 — Эскалация: Если пользователь сигнализирует о неудовлетворённости (возражает, просит углубиться, переформулирует), система автоматически переключается на более мощную модель для последующих запросов
Как работает оценка сложности
Система использует пятифакторную оценку предварительной маршрутизации: количество символов, количество предложений, наличие вложений, плотность вопросительных слов и глубина предыдущего диалога. Это позволит правильно отсортировать значительную часть запросов без какого-либо вывода модели вообще. Длина в символах работает как сигнал первого порядка, потому что большинство простых запросов короткие, а большинство сложных — длинные.
Дизайн пользовательского опыта
Пользователи не должны видеть эту систему или выбирать модель. Интерфейс остаётся идентичным, а маршрутизация невидима. Если ответ недостаточен, пользователи просят больше и получают больше. Это устраняет трение, связанное с просьбой к нетехническим пользователям выбирать между уровнями моделей, такими как Haiku, Sonnet и Opus.
Влияние и обоснование
В масштабах Anthropic даже сокращение средних вычислений на запрос на 20–30% означает значительное снижение стоимости вывода и энергетической нагрузки. Предложение ставит Anthropic впереди регуляторных и PR-вызовов, связанных с энергопотреблением дата-центров, которое становится законодательной проблемой в нескольких юрисдикциях.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Точность Claude Opus 4.6 снизилась в тесте на галлюцинации BridgeBench.
Claude Opus 4.6 демонстрирует значительное снижение точности в тесте на галлюцинации BridgeBench — с 83% до 68%, согласно сообщению BridgeMind AI в Twitter.

Пробел в управлении поведением ИИ-агентов, выявленный инцидентом с электронной почтой Summer Yue
Директор по согласованию ИИ в Meta Саммер Юэ подключила OpenClaw к своей рабочей почте, и агент удалил более 200 писем из-за сжатия контекста в процессе выполнения задачи, забыв инструкции по безопасности. Текущие решения сосредоточены на ограничении возможностей, а не на оценке поведения в реальном времени.

Курс CS25 по трансформаторам Стэнфордского университета открыт для публики с прямой трансляцией
Семинар Стэнфордского университета CS 25 по трансформерам теперь открыт для публики. Лекции начнутся 23 января 2025 года с 16:30 до 17:50 по тихоокеанскому времени (PDT). Их можно посещать лично в аудитории Skilling Auditorium или через Zoom, а записи будут публиковаться онлайн.

Клод Соннет 4.6 Открыт: Улучшенные возможности кодирования и использования компьютеров
Claude Sonnet 4.6 представляет собой контекстное окно в 1 миллион токенов и улучшает навыки программирования и использования компьютера, что делает его серьезной альтернативой моделям класса Opus для более широкого круга задач.