Reduza 79% tokens do Claude com nova CLI do Infracost

Infracost, uma ferramenta de CLI que estima custos de infraestrutura na nuvem a partir de Terraform, CloudFormation e CDK, redesenhou sua saída para agentes de codificação de IA como Claude Code e Cursor. O resultado: até 79% menos tokens de saída e 67% menos custos de API em comparação com uma linha de base apenas com Claude. O redesenho gira em torno de duas técnicas: pushdown de predicados na CLI e um formato de saída eficiente em tokens.

Detalhes do benchmark

16 perguntas sobre um fixture Terraform de 3 projetos com 1.171 recursos
Modelo: Claude Opus, 5 repetições por pergunta
Linha de base: Claude puro com ferramentas Bash e Read, sem skill carregado
Comparado com o skill Infracost com a flag de saída --llm

Resultados principais

Métrica	Claude puro	Com skill Infracost (--llm)	Mudança
Respostas corretas	5 / 11 (45%)	11 / 11 (100%)	+6
Custo total (USD)	$16.41	$9.63	-41%
Tokens de saída	207.017	81.697	-61%
Tempo real	50 min	50 min	empate

Um exemplo: a pergunta "contar recursos distintos que falham na política de tagging, desduplicados entre projetos" custou $3.51 com Claude puro e atingiu o limite de 25 turnos, sem retornar resposta. Com a CLI redesenhada, a mesma pergunta custou $0.25 e retornou a resposta correta.

Abordagem técnica

Pushdown de predicados: Em vez de fazer o agente canalizar JSON através de jq ou escrever parsers Python, a CLI aceita flags de filtragem (por exemplo, --tag-policy), transferindo a computação para a própria ferramenta. Isso reduz o número de turnos e o consumo de tokens.
Formato de saída eficiente em tokens: A flag --llm retorna um formato compacto e amigável para agentes, em vez de tabelas verbosas legíveis por humanos ou JSON completo. Isso sozinho é responsável por uma parcela significativa da redução.

Armadilhas do harness de benchmark

Infracost abriu o código do seu harness para ajudar outros a evitar armadilhas:

Sandbox HOME para execuções de linha de base, evitando carregamento acidental de skills
Definir TMPDIR para um diretório local do projeto para contornar problemas de ACL do macOS
Adicionar o binário de teste ao PATH em vez de confiar na instalação do sistema
Usar 5+ repetições por célula devido à variação de 20-30% nos tokens
Reexecutar células que atingiram o limite de turnos (--rerun-failed) e reavaliar se o verificador mudar (--rescore)

Se você mantém uma CLI que agentes de IA chamam como subprocesso, as mesmas duas ações — pushdown de predicados e um formato de saída dedicado para agentes — provavelmente se aplicam. O redesenho também melhorou a CLI voltada para humanos, embora o artigo foque no caminho dos agentes.

📖 Leia a fonte completa: HN AI Agents