Infracost сокращает использование токенов Claude на 79% за счет перепроектирования CLI для AI-агентов

Infracost, инструмент CLI, оценивающий стоимость облачной инфраструктуры на основе Terraform, CloudFormation и CDK, переработал свой вывод для ИИ-агентов кодирования, таких как Claude Code и Cursor. Результат: до 79% меньше выходных токенов и 67% ниже стоимость API по сравнению с базовым Claude. Переработка вращается вокруг двух методов: перенос предикатов в CLI и выходной формат, эффективный по токенам.
Детали бенчмарка
- 16 вопросов по тестовому набору из 3 проектов Terraform с 1171 ресурсом
- Модель: Claude Opus, 5 повторений на вопрос
- Базовый уровень: обычный Claude с инструментами Bash и Read, без загруженных навыков
- Сравнение с навыком Infracost с флагом вывода
--llm
Ключевые результаты
| Метрика | Обычный Claude | С навыком Infracost (--llm) | Изменение |
|---|---|---|---|
| Правильные ответы | 5 / 11 (45%) | 11 / 11 (100%) | +6 |
| Общая стоимость (USD) | $16.41 | $9.63 | -41% |
| Выходные токены | 207,017 | 81,697 | -61% |
| Общее время | 50 мин | 50 мин | равно |
Пример: вопрос "подсчитать уникальные ресурсы, нарушающие политику тегирования, без дублирования по проектам" обошелся в $3.51 с обычным Claude и достиг лимита в 25 итераций, не вернув ответа. С переработанным CLI тот же вопрос стоил $0.25 и вернул правильный ответ.
Технический подход
- Перенос предикатов: Вместо того чтобы агент передавал JSON через
jqили писал парсеры на Python, CLI принимает флаги фильтрации (например,--tag-policy), перекладывая вычисления на сам инструмент. Это уменьшает количество итераций и потребление токенов. - Выходной формат, эффективный по токенам: Флаг
--llmвозвращает компактный, удобный для агента формат вместо многословных человекочитаемых таблиц или полного JSON. Это само по себе обеспечивает значительную долю сокращения.
Особенности настройки бенчмарка
Infracost опубликовал свою настройку в открытом доступе, чтобы помочь другим избежать ошибок:
- Установка
HOMEв песочнице для базовых запусков, чтобы избежать случайной загрузки навыков - Установка
TMPDIRв локальную директорию проекта для обхода проблем с ACL в macOS - Добавление тестового бинарника в
PATHвместо использования системной установки - Использование 5+ повторений на ячейку из-за 20-30% вариации токенов
- Повторный запуск ячеек, достигших лимита итераций (
--rerun-failed), и переоценка при изменении верификатора (--rescore)
Если вы поддерживаете CLI, который ИИ-агенты вызывают как подпроцесс, те же два шага — перенос предикатов и специальный выходной формат для агентов — скорее всего, применимы. Переработка также улучшила CLI для людей, хотя статья сосредоточена на пути для агентов.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Самостоятельно размещенный контекстный бандит на Rust: Syntra и Lycan для адаптивных систем принятия решений
Два проекта с открытым исходным кодом: Lycan (язык выполнения графов с узлами стратегий и обученными весами) и Syntra (приложение Docker/API, обслуживающее скомпилированные капсулы Lycan). При использовании на собственном продукте для дебатов по AI-акциям обнаружили ошибки в конвейере данных до ошибок времени выполнения.

LobsterBoard добавляет систему тем и галерею шаблонов
LobsterBoard теперь включает систему тем с пятью визуальными вариантами и галерею шаблонов, которая позволяет пользователям экспортировать и импортировать макеты дашбордов с автоматическим удалением конфиденциальных данных.

AgentPVP: Агент-ориентированная соревновательная арена LLM с ELO, соперничеством и песочницей для инъекций промптов
AgentPVP позволяет агентам LLM регистрироваться, играть в 5 настольных игр через JSON API, вести рейтинг ELO для каждой игры, вести файлы соперничества и подшучивать друг над другом в общем чате. HTML опционален — API и есть сайт.

iai-mcp: локальный демон для постоянной памяти OpenClaw между сессиями
iai-mcp — это открытый демон, который перехватывает все разговоры OpenClaw, хранит их в трёх уровнях памяти с локальными нейронными эмбеддингами и шифрованием AES-256, а при новых сессиях подгружает релевантный контекст — точность воспроизведения >99%, время поиска <100мс, стоимость начала сессии <3к токенов.