인프라코스트, AI 에이전트를 위한 CLI 재설계로 클로드 토큰 사용량 79% 절감

✍️ OpenClawRadar📅 게시일: May 19, 2026🔗 Source
인프라코스트, AI 에이전트를 위한 CLI 재설계로 클로드 토큰 사용량 79% 절감
Ad

Infracost는 Terraform, CloudFormation, CDK로부터 클라우드 인프라 비용을 추정하는 CLI 도구로, Claude Code 및 Cursor와 같은 AI 코딩 에이전트를 위해 출력을 재설계했습니다. 그 결과, bare-Claude 기준 대비 출력 토큰이 최대 79% 감소하고 API 비용이 67% 절감되었습니다. 이 재설계는 두 가지 기술을 중심으로 이루어졌습니다: CLI로의 조건 푸시다운(predicate pushdown)과 토큰 효율적인 출력 형식입니다.

벤치마크 세부 사항

  • 1,171개 리소스를 가진 3개 프로젝트 Terraform 픽스처에 대한 16개 질문
  • 모델: Claude Opus, 질문당 5회 반복
  • 기준: Bash 및 Read 도구를 사용한 bare Claude, 스킬 미탑재
  • 비교 대상: --llm 출력 플래그가 있는 Infracost 스킬

주요 결과

측정 항목Bare ClaudeInfracost 스킬 포함 (--llm)변화
정답 수5 / 11 (45%)11 / 11 (100%)+6
총 비용 (USD)$16.41$9.63-41%
출력 토큰207,01781,697-61%
경과 시간50분50분동일

한 예로, "프로젝트 간 중복 제거된 태깅 정책을 위반하는 고유 리소스 개수"라는 질문은 bare Claude로 $3.51의 비용이 들었고 25턴 제한에 도달하여 답변을 반환하지 못했습니다. 재설계된 CLI로 동일한 질문은 $0.25의 비용으로 정확한 답변을 반환했습니다.

Ad

기술적 접근 방식

  • 조건 푸시다운: 에이전트가 JSON을 jq로 파이프하거나 Python 파서를 작성하는 대신, CLI가 필터링 플래그(예: --tag-policy)를 받아들이도록 하여 계산을 도구 자체에 오프로드합니다. 이는 턴 수와 토큰 소비를 줄입니다.
  • 토큰 효율적인 출력 형식: --llm 플래그는 장황한 사람이 읽기 쉬운 테이블이나 전체 JSON 대신 간결하고 에이전트 친화적인 형식을 반환합니다. 이는 감소량의 상당 부분을 차지합니다.

벤치마크 환경의 주의 사항

Infracost는 다른 사람들이 함정을 피할 수 있도록 자체 환경 설정을 오픈소스로 공개했습니다:

  • 기준 실행을 위해 샌드박스 HOME을 사용하여 우발적인 스킬 로딩 방지
  • macOS ACL 문제를 우회하기 위해 TMPDIR을 프로젝트 로컬 디렉토리로 설정
  • 시스템 설치에 의존하지 않고 테스트 바이너리를 PATH에 앞에 추가
  • 20-30%의 토큰 변동성 때문에 셀당 5회 이상 반복
  • 턴 제한에 도달한 셀 재실행(--rerun-failed) 및 검증기가 변경된 경우 재채점(--rescore)

AI 에이전트가 서브프로세스로 호출하는 CLI를 유지 관리한다면, 조건 푸시다운과 전용 에이전트 출력 형식이라는 동일한 두 가지 방법이 적용될 가능성이 높습니다. 이 재설계는 사람을 위한 CLI도 개선했지만, 이 글은 에이전트 경로에 초점을 맞추고 있습니다.

📖 전체 출처 읽기: HN AI Agents

Ad

👀 See Also

MCP 서버는 쿠키와 인증 정보를 사용하여 AI 에이전트를 기존 Chrome 세션에 연결합니다.
Tools

MCP 서버는 쿠키와 인증 정보를 사용하여 AI 에이전트를 기존 Chrome 세션에 연결합니다.

@playwright-repl/mcp는 Dramaturg 확장 프로그램을 통해 AI 에이전트가 기존 Chrome 브라우저에 연결할 수 있는 MCP 서버로, 쿠키와 인증을 포함한 실제 브라우저 세션에 접근할 수 있습니다. 전체 Playwright JavaScript와 어설션을 지원하며 Claude Desktop, Claude Code, Cursor 또는 모든 MCP 클라이언트와 함께 작동합니다.

OpenClawRadar
BottyFans: USDC로 AI 에이전트 수익화를 위한 오픈 API
Tools

BottyFans: USDC로 AI 에이전트 수익화를 위한 오픈 API

새로운 플랫폼이 AI 에이전트가 구독, 팁, 유료 콘텐츠를 USDC로 처리하는 자체 크리에이터 비즈니스를 운영할 수 있도록 합니다.

OpenClaw Radar
Claude Code, TLA+ 모델 체킹을 tla-mcp MCP 서버를 통해 지원하게 되다
Tools

Claude Code, TLA+ 모델 체킹을 tla-mcp MCP 서버를 통해 지원하게 되다

tla-mcp는 Claude Code가 TLA+ 모델 검사기 tla-rs를 일급 도구로 호출할 수 있게 해주는 새로운 MCP 서버입니다. 사양 검증, 역추적 예제를 포함한 경계 검사 실행, 채팅에서 시나리오 재생이 가능합니다.

OpenClawRadar
DebugBase: AI 코딩 에이전트를 위한 MCP 기반 집단 오류 지식 베이스
Tools

DebugBase: AI 코딩 에이전트를 위한 MCP 기반 집단 오류 지식 베이스

DebugBase는 MCP 호환 도구로, Next.js 하이드레이션 불일치나 TypeScript 해결 문제와 같은 일반적인 오류에 대한 알려진 수정 사항을 AI 코딩 에이전트가 확인할 수 있는 공유 지식 베이스를 제공합니다. 11개의 MCP 도구를 포함하며 실제 에이전트 세션에서 가져온 58개의 오류/수정 쌍으로 사전 구성되어 있습니다.

OpenClawRadar