Infracost сокращает использование токенов Claude на 79% за счет перепроектирования CLI для AI-агентов

✍️ OpenClawRadar📅 Опубликовано: 19 мая 2026 г.🔗 Source
Infracost сокращает использование токенов Claude на 79% за счет перепроектирования CLI для AI-агентов
Ad

Infracost, инструмент CLI, оценивающий стоимость облачной инфраструктуры на основе Terraform, CloudFormation и CDK, переработал свой вывод для ИИ-агентов кодирования, таких как Claude Code и Cursor. Результат: до 79% меньше выходных токенов и 67% ниже стоимость API по сравнению с базовым Claude. Переработка вращается вокруг двух методов: перенос предикатов в CLI и выходной формат, эффективный по токенам.

Детали бенчмарка

  • 16 вопросов по тестовому набору из 3 проектов Terraform с 1171 ресурсом
  • Модель: Claude Opus, 5 повторений на вопрос
  • Базовый уровень: обычный Claude с инструментами Bash и Read, без загруженных навыков
  • Сравнение с навыком Infracost с флагом вывода --llm

Ключевые результаты

МетрикаОбычный ClaudeС навыком Infracost (--llm)Изменение
Правильные ответы5 / 11 (45%)11 / 11 (100%)+6
Общая стоимость (USD)$16.41$9.63-41%
Выходные токены207,01781,697-61%
Общее время50 мин50 минравно

Пример: вопрос "подсчитать уникальные ресурсы, нарушающие политику тегирования, без дублирования по проектам" обошелся в $3.51 с обычным Claude и достиг лимита в 25 итераций, не вернув ответа. С переработанным CLI тот же вопрос стоил $0.25 и вернул правильный ответ.

Ad

Технический подход

  • Перенос предикатов: Вместо того чтобы агент передавал JSON через jq или писал парсеры на Python, CLI принимает флаги фильтрации (например, --tag-policy), перекладывая вычисления на сам инструмент. Это уменьшает количество итераций и потребление токенов.
  • Выходной формат, эффективный по токенам: Флаг --llm возвращает компактный, удобный для агента формат вместо многословных человекочитаемых таблиц или полного JSON. Это само по себе обеспечивает значительную долю сокращения.

Особенности настройки бенчмарка

Infracost опубликовал свою настройку в открытом доступе, чтобы помочь другим избежать ошибок:

  • Установка HOME в песочнице для базовых запусков, чтобы избежать случайной загрузки навыков
  • Установка TMPDIR в локальную директорию проекта для обхода проблем с ACL в macOS
  • Добавление тестового бинарника в PATH вместо использования системной установки
  • Использование 5+ повторений на ячейку из-за 20-30% вариации токенов
  • Повторный запуск ячеек, достигших лимита итераций (--rerun-failed), и переоценка при изменении верификатора (--rescore)

Если вы поддерживаете CLI, который ИИ-агенты вызывают как подпроцесс, те же два шага — перенос предикатов и специальный выходной формат для агентов — скорее всего, применимы. Переработка также улучшила CLI для людей, хотя статья сосредоточена на пути для агентов.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

Самостоятельно размещенный контекстный бандит на Rust: Syntra и Lycan для адаптивных систем принятия решений
Инструменты

Самостоятельно размещенный контекстный бандит на Rust: Syntra и Lycan для адаптивных систем принятия решений

Два проекта с открытым исходным кодом: Lycan (язык выполнения графов с узлами стратегий и обученными весами) и Syntra (приложение Docker/API, обслуживающее скомпилированные капсулы Lycan). При использовании на собственном продукте для дебатов по AI-акциям обнаружили ошибки в конвейере данных до ошибок времени выполнения.

OpenClawRadar
LobsterBoard добавляет систему тем и галерею шаблонов
Инструменты

LobsterBoard добавляет систему тем и галерею шаблонов

LobsterBoard теперь включает систему тем с пятью визуальными вариантами и галерею шаблонов, которая позволяет пользователям экспортировать и импортировать макеты дашбордов с автоматическим удалением конфиденциальных данных.

OpenClawRadar
AgentPVP: Агент-ориентированная соревновательная арена LLM с ELO, соперничеством и песочницей для инъекций промптов
Инструменты

AgentPVP: Агент-ориентированная соревновательная арена LLM с ELO, соперничеством и песочницей для инъекций промптов

AgentPVP позволяет агентам LLM регистрироваться, играть в 5 настольных игр через JSON API, вести рейтинг ELO для каждой игры, вести файлы соперничества и подшучивать друг над другом в общем чате. HTML опционален — API и есть сайт.

OpenClawRadar
iai-mcp: локальный демон для постоянной памяти OpenClaw между сессиями
Инструменты

iai-mcp: локальный демон для постоянной памяти OpenClaw между сессиями

iai-mcp — это открытый демон, который перехватывает все разговоры OpenClaw, хранит их в трёх уровнях памяти с локальными нейронными эмбеддингами и шифрованием AES-256, а при новых сессиях подгружает релевантный контекст — точность воспроизведения >99%, время поиска <100мс, стоимость начала сессии <3к токенов.

OpenClawRadar