NerfGuard: Классификатор, направляющий запросы кода на более дешевые модели, сокращая расходы в 3 раза

Команда, перешедшая с Claude Code на Codex ради скорости и управляемости, столкнулась с серьезными затратами на токены. Ежедневный счет был впечатляющим, и они заметили, что используют топовые модели с максимальными рассуждениями для каждой задачи, даже тривиальной. Поэтому они создали NerfGuard — быстрый классификатор, который направляет каждый запрос в самую дешевую модель с необходимой глубиной рассуждений.
Основой является классификатор, определяющий минимальный уровень интеллекта, необходимый для данного запроса кодирования. Сверху применяются автоматические методы эффективности токенов. Результат: примерно то же качество при многократно меньших затратах токенов, а из-за правильного распределения интеллекта и рассуждений скорость также значительно возрастает. Команда наблюдала до 3-кратной экономии и сэкономленных часов в день на человека, потраченных ранее на ожидание ответов инструментов и агентов.
Ключевые детали из источника:
- Классификатор направляет в самую дешевую модель + глубину рассуждений для каждого запроса
- Дополнительные автоматические методы эффективности токенов
- Результат: 3-кратное использование при тех же затратах
- Улучшение скорости: сэкономленные часы в день на человека
- Больше использований до достижения лимитов
В настоящее время используется инженерами в нескольких AI-компаниях. Инструмент доступен на nerfguard.com.
Для кого это: команды, использующие кодировочные агенты (Claude Code, Codex и т.д.), которые хотят максимизировать отдачу на доллар и сократить время ожидания.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

OpenAlly: Локальный ИИ-помощник для Android с управлением телефоном
OpenAlly — это приложение для Android, которое запускает ИИ-ассистента локально на вашем телефоне через встроенный процесс Node.js, с 51 встроенным навыком и возможностями управления телефоном через компаньон Aster. Оно подключается к 19+ мессенджерам и поддерживает 18 провайдеров моделей с вашими собственными API-ключами.

MoltMarket: Платформа для найма ИИ-агентов для выполнения цифровых задач
MoltMarket — это бесплатная платформа, где пользователи могут размещать задания для выполнения автономными ИИ-агентами. На маркетплейсе уже зарегистрировано более 100 пользователей и верифицированных агентов, способных выполнять такие задачи, как веб-скрапинг, генерация кода и написание контента.

MatchKit: Генератор дизайн-систем для проектов Claude Code
MatchKit — это инструмент, который создает полные фирменные дизайн-системы для проектов, разработанных с помощью Claude Code. Он извлекает цвета бренда из загруженных логотипов и генерирует настраиваемые компоненты, макеты и дизайн-токены, чтобы избежать шаблонного вида, характерного для инструментов ИИ-разработки.

Пользователь OpenClaw создает навык 'feelslikeclaude' для улучшения поведения рабочего процесса агента ChatGPT.
Разработчик переключил свою настройку OpenClaw с Claude на ChatGPT и обнаружил, что ключевое различие заключается в поведении рабочего процесса, а не в стиле письма. Он создал навык clawhub под названием 'feelslikeclaude', чтобы подтолкнуть ChatGPT к лучшим привычкам выполнения задач.