NerfGuard: Классификатор, направляющий запросы кода на более дешевые модели, сокращая расходы в 3 раза

✍️ OpenClawRadar📅 Опубликовано: 6 июня 2026 г.🔗 Source
NerfGuard: Классификатор, направляющий запросы кода на более дешевые модели, сокращая расходы в 3 раза
Ad

Команда, перешедшая с Claude Code на Codex ради скорости и управляемости, столкнулась с серьезными затратами на токены. Ежедневный счет был впечатляющим, и они заметили, что используют топовые модели с максимальными рассуждениями для каждой задачи, даже тривиальной. Поэтому они создали NerfGuard — быстрый классификатор, который направляет каждый запрос в самую дешевую модель с необходимой глубиной рассуждений.

Основой является классификатор, определяющий минимальный уровень интеллекта, необходимый для данного запроса кодирования. Сверху применяются автоматические методы эффективности токенов. Результат: примерно то же качество при многократно меньших затратах токенов, а из-за правильного распределения интеллекта и рассуждений скорость также значительно возрастает. Команда наблюдала до 3-кратной экономии и сэкономленных часов в день на человека, потраченных ранее на ожидание ответов инструментов и агентов.

Ad

Ключевые детали из источника:

  • Классификатор направляет в самую дешевую модель + глубину рассуждений для каждого запроса
  • Дополнительные автоматические методы эффективности токенов
  • Результат: 3-кратное использование при тех же затратах
  • Улучшение скорости: сэкономленные часы в день на человека
  • Больше использований до достижения лимитов

В настоящее время используется инженерами в нескольких AI-компаниях. Инструмент доступен на nerfguard.com.

Для кого это: команды, использующие кодировочные агенты (Claude Code, Codex и т.д.), которые хотят максимизировать отдачу на доллар и сократить время ожидания.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

OpenAlly: Локальный ИИ-помощник для Android с управлением телефоном
Инструменты

OpenAlly: Локальный ИИ-помощник для Android с управлением телефоном

OpenAlly — это приложение для Android, которое запускает ИИ-ассистента локально на вашем телефоне через встроенный процесс Node.js, с 51 встроенным навыком и возможностями управления телефоном через компаньон Aster. Оно подключается к 19+ мессенджерам и поддерживает 18 провайдеров моделей с вашими собственными API-ключами.

OpenClawRadar
MoltMarket: Платформа для найма ИИ-агентов для выполнения цифровых задач
Инструменты

MoltMarket: Платформа для найма ИИ-агентов для выполнения цифровых задач

MoltMarket — это бесплатная платформа, где пользователи могут размещать задания для выполнения автономными ИИ-агентами. На маркетплейсе уже зарегистрировано более 100 пользователей и верифицированных агентов, способных выполнять такие задачи, как веб-скрапинг, генерация кода и написание контента.

OpenClawRadar
MatchKit: Генератор дизайн-систем для проектов Claude Code
Инструменты

MatchKit: Генератор дизайн-систем для проектов Claude Code

MatchKit — это инструмент, который создает полные фирменные дизайн-системы для проектов, разработанных с помощью Claude Code. Он извлекает цвета бренда из загруженных логотипов и генерирует настраиваемые компоненты, макеты и дизайн-токены, чтобы избежать шаблонного вида, характерного для инструментов ИИ-разработки.

OpenClawRadar
Пользователь OpenClaw создает навык 'feelslikeclaude' для улучшения поведения рабочего процесса агента ChatGPT.
Инструменты

Пользователь OpenClaw создает навык 'feelslikeclaude' для улучшения поведения рабочего процесса агента ChatGPT.

Разработчик переключил свою настройку OpenClaw с Claude на ChatGPT и обнаружил, что ключевое различие заключается в поведении рабочего процесса, а не в стиле письма. Он создал навык clawhub под названием 'feelslikeclaude', чтобы подтолкнуть ChatGPT к лучшим привычкам выполнения задач.

OpenClawRadar