오픈소스 로컬 훅이 AI 비용을 절감하기 위해 Claude 모델을 자동으로 전환합니다

✍️ OpenClawRadar📅 게시일: March 7, 2026🔗 Source
오픈소스 로컬 훅이 AI 비용을 절감하기 위해 Claude 모델을 자동으로 전환합니다
Ad

한 개발자가 코딩 작업 유형에 따라 가장 비용 효율적인 Claude AI 모델을 자동으로 선택하는 로컬 훅을 오픈소스로 공개했습니다. 이 도구는 품질 저하 없이 AI 비용을 50-70%까지 절감할 수 있습니다.

작동 방식

이 도구는 각 프롬프트가 전송되기 전에 Cursor와 Claude Code(둘 다 동일한 훅 시스템 사용)에서 로컬 훅으로 실행됩니다. Opus/plan 옆에 위치하여 비싼 모델에 도달하기 전에 명백히 부적합한 모델 매칭을 방지하는 효율적인 프론트엔드 필터 역할을 합니다.

주요 기능

  • 프롬프트와 현재 모델 선택을 읽음
  • 간단한 키워드 규칙을 사용해 작업 분류(git 작업, 기능 작업, 아키텍처/심층 분석)
  • 과다 지불 시 차단(예: git 커밋에 Opus 사용)하고 Haiku 또는 Sonnet 제안
  • 성능 부족 시 차단(아키텍처에 Sonnet/Haiku 사용)하고 Opus 제안
  • 그 외 모든 것은 변경 없이 통과
  • ! 접두사를 사용하면 제안에 동의하지 않을 때 필터를 완전히 우회 가능

기술적 세부사항

  • 3개 파일: bash + python3 + JSON
  • 프록시 없음, API 호출 없음, 외부 서비스 없음
  • Fail-open 설계: 중단되면 Claude Code가 정상적으로 진행
  • 오픈소스 위치: https://github.com/coyvalyss1/model-matchmaker

성능 및 테스트

개발자가 몇 주간 자신의 프롬프트를 분석한 결과:

  • 60-70%는 Sonnet이 처리할 수 있는 표준 기능 작업
  • 5-20%는 디버깅/문제 해결
  • 상당 부분은 순수 git/이름 변경/포맷팅 작업으로 Haiku가 90% 낮은 비용으로 동일하게 처리

사후 분석 결과, 이 도구가 품질 저하 없이 AI 지출의 50-70%를 절감했을 것으로 나타났습니다. 조정 후 실제 테스트 프롬프트 12개 중 12개를 올바르게 처리했습니다.

해결하는 문제

문제는 지식이 아니라 마찰입니다. 개발자들은 모델을 전환해야 한다는 것을 알고 있지만, 집중 상태에서는 드롭다운 메뉴를 생각하고 싶어하지 않습니다. 이 도구는 의사 결정 과정을 자동화합니다.

📖 전체 소스 읽기: r/ClaudeAI

Ad

👀 See Also

클로드 API 트래픽 라우팅으로 Max 구독 변경 후 비용 통제하기
Tools

클로드 API 트래픽 라우팅으로 Max 구독 변경 후 비용 통제하기

Anthropic의 Max 구독이 더 이상 OpenClaw와 같은 타사 도구 사용을 포함하지 않아 OpenClaw 사용자들이 API 청구로 전환해야 합니다. 라우팅 프록시는 간단한 작업은 Claude Sonnet(입력 100만 토큰당 $3, 출력 100만 토큰당 $15)으로, 복잡한 작업은 Opus(입력 100만 토큰당 $5, 출력 100만 토큰당 $25)로 보내 품질 손실 없이 비용을 절감합니다.

OpenClawRadar
플렝: AI 기반 인프라 관리 기능을 갖춘 셀프 호스팅 클라우드 플랫폼
Tools

플렝: AI 기반 인프라 관리 기능을 갖춘 셀프 호스팅 클라우드 플랫폼

Pleng은 AGPL-3.0 라이선스로 제공되는 셀프 호스팅 클라우드 플랫폼으로, AI 에이전트(현재 Claude)를 사용하여 텔레그램 봇 명령어를 통해 인프라를 관리합니다. GitHub 저장소나 로컬 디렉토리에서 자동화된 Traefik 라우팅, Let's Encrypt SSL, 기본 분석 기능을 갖춘 상태로 배포합니다.

OpenClawRadar
ATLAS: Qwen3-14B의 프론티어 수준 코딩 성능을 달성한 오픈소스 테스트 타임 컴퓨팅 파이프라인
Tools

ATLAS: Qwen3-14B의 프론티어 수준 코딩 성능을 달성한 오픈소스 테스트 타임 컴퓨팅 파이프라인

한 대학생이 Qwen3-14B를 기반으로 구축한 오픈소스 테스트 타임 컴퓨팅 파이프라인인 ATLAS를 개발했습니다. 이 시스템은 LiveCodeBench v5 문제에서 작업당 약 0.004달러의 전기 비용으로 74.6%의 pass@1 성능을 달성합니다. 복잡한 문제에서는 느리지만 GPT-5(84.6%) 및 Claude 4.5 Sonnet(71.4%)와 같은 최첨단 모델과 비슷한 성능을 제공합니다.

OpenClawRadar
TideSurf: DOM 압축 도구로 웹 에이전트 토큰 사용량 30배 감소, TTFT 12배 가속
Tools

TideSurf: DOM 압축 도구로 웹 에이전트 토큰 사용량 30배 감소, TTFT 12배 가속

TideSurf v0.3는 렌더링된 DOM을 마크다운과 유사한 압축 형식으로 변환하여, GitHub 페이지에서 원시 DOM 대비 토큰 소비를 32배 줄이면서 LLM 에이전트를 위한 18가지 인터랙티브 도구를 추가합니다.

OpenClawRadar