Infracost сокращает использование токенов Claude на 79% за счет перепроектирования CLI для AI-агентов

✍️ OpenClawRadar📅 Опубликовано: 19 мая 2026 г.🔗 Source

$Infracost сокращает использование токенов Claude на 79% за счет перепроектирования CLI для AI-агентов$

Infracost, инструмент CLI, оценивающий стоимость облачной инфраструктуры на основе Terraform, CloudFormation и CDK, переработал свой вывод для ИИ-агентов кодирования, таких как Claude Code и Cursor. Результат: до 79% меньше выходных токенов и 67% ниже стоимость API по сравнению с базовым Claude. Переработка вращается вокруг двух методов: перенос предикатов в CLI и выходной формат, эффективный по токенам.

Детали бенчмарка

16 вопросов по тестовому набору из 3 проектов Terraform с 1171 ресурсом
Модель: Claude Opus, 5 повторений на вопрос
Базовый уровень: обычный Claude с инструментами Bash и Read, без загруженных навыков
Сравнение с навыком Infracost с флагом вывода --llm

Ключевые результаты

Метрика	Обычный Claude	С навыком Infracost (--llm)	Изменение
Правильные ответы	5 / 11 (45%)	11 / 11 (100%)	+6
Общая стоимость (USD)	$16.41	$9.63	-41%
Выходные токены	207,017	81,697	-61%
Общее время	50 мин	50 мин	равно

Пример: вопрос "подсчитать уникальные ресурсы, нарушающие политику тегирования, без дублирования по проектам" обошелся в $3.51 с обычным Claude и достиг лимита в 25 итераций, не вернув ответа. С переработанным CLI тот же вопрос стоил $0.25 и вернул правильный ответ.

Технический подход

Перенос предикатов: Вместо того чтобы агент передавал JSON через jq или писал парсеры на Python, CLI принимает флаги фильтрации (например, --tag-policy), перекладывая вычисления на сам инструмент. Это уменьшает количество итераций и потребление токенов.
Выходной формат, эффективный по токенам: Флаг --llm возвращает компактный, удобный для агента формат вместо многословных человекочитаемых таблиц или полного JSON. Это само по себе обеспечивает значительную долю сокращения.

Особенности настройки бенчмарка

Infracost опубликовал свою настройку в открытом доступе, чтобы помочь другим избежать ошибок:

Установка HOME в песочнице для базовых запусков, чтобы избежать случайной загрузки навыков
Установка TMPDIR в локальную директорию проекта для обхода проблем с ACL в macOS
Добавление тестового бинарника в PATH вместо использования системной установки
Использование 5+ повторений на ячейку из-за 20-30% вариации токенов
Повторный запуск ячеек, достигших лимита итераций (--rerun-failed), и переоценка при изменении верификатора (--rescore)

Если вы поддерживаете CLI, который ИИ-агенты вызывают как подпроцесс, те же два шага — перенос предикатов и специальный выходной формат для агентов — скорее всего, применимы. Переработка также улучшила CLI для людей, хотя статья сосредоточена на пути для агентов.

📖 Читать полный источник: HN AI Agents

👀 Смотрите также

Инструменты

Fable 5 в Claude Code: Анализ затрат первого дня — эквивалент $210 через API, $0 оплачено

Разработчик переключился на claude-fable-5 в Claude Code и измерил использование токенов в 742 ответах. Эквивалентная стоимость API: $210.15. Фактически уплачено: $0 в период до 22 июня.

11 июн. 2026 г., 12:20 UTC

OpenClawRadar

Инструменты

Открытые ИИ-контекстные пакеты для вопросов в сфере права, соответствия требованиям и финансов

Разработчик использовал Claude для исследования и создания 32 бесплатных, открытых контекстных пакетов, которые предоставляют конкретные ответы на юридические, регуляторные и финансовые вопросы вместо общих рекомендаций «проконсультируйтесь с юристом». Пакеты охватывают GDPR, контракты, биллинг SaaS, Закон ЕС об ИИ и другие темы.

21 мар. 2026 г., 00:45 UTC

OpenClawRadar

Инструменты

soul.py добавляет постоянную память локальным LLM с помощью простого файлового подхода.

soul.py — это библиотека Python, которая добавляет постоянную память любому LLM, используя два файла в формате markdown для идентификации и ведения журнала разговоров, работая с моделями Ollama, OpenAI и Anthropic без необходимости в базах данных или серверах.

2 мар. 2026 г., 12:45 UTC

OpenClawRadar

Инструменты

Анализ акций в реальном времени добавлен в Claude Desktop через MCP-сервер

Разработчик создал MCP-сервер под названием agent-toolbelt, который добавляет возможности анализа акций в реальном времени в Claude Desktop и Claude Code. Инструмент предоставляет пять конкретных аналитических функций и работает с установкой одной командой.

21 мар. 2026 г., 05:45 UTC

OpenClawRadar