Claude 모델 자동 전환 로컬 훅, AI 비용 50-70% 절감

한 개발자가 코딩 작업 유형에 따라 가장 비용 효율적인 Claude AI 모델을 자동으로 선택하는 로컬 훅을 오픈소스로 공개했습니다. 이 도구는 품질 저하 없이 AI 비용을 50-70%까지 절감할 수 있습니다.

작동 방식

이 도구는 각 프롬프트가 전송되기 전에 Cursor와 Claude Code(둘 다 동일한 훅 시스템 사용)에서 로컬 훅으로 실행됩니다. Opus/plan 옆에 위치하여 비싼 모델에 도달하기 전에 명백히 부적합한 모델 매칭을 방지하는 효율적인 프론트엔드 필터 역할을 합니다.

주요 기능

프롬프트와 현재 모델 선택을 읽음
간단한 키워드 규칙을 사용해 작업 분류(git 작업, 기능 작업, 아키텍처/심층 분석)
과다 지불 시 차단(예: git 커밋에 Opus 사용)하고 Haiku 또는 Sonnet 제안
성능 부족 시 차단(아키텍처에 Sonnet/Haiku 사용)하고 Opus 제안
그 외 모든 것은 변경 없이 통과
! 접두사를 사용하면 제안에 동의하지 않을 때 필터를 완전히 우회 가능

기술적 세부사항

3개 파일: bash + python3 + JSON
프록시 없음, API 호출 없음, 외부 서비스 없음
Fail-open 설계: 중단되면 Claude Code가 정상적으로 진행
오픈소스 위치: https://github.com/coyvalyss1/model-matchmaker

성능 및 테스트

개발자가 몇 주간 자신의 프롬프트를 분석한 결과:

60-70%는 Sonnet이 처리할 수 있는 표준 기능 작업
5-20%는 디버깅/문제 해결
상당 부분은 순수 git/이름 변경/포맷팅 작업으로 Haiku가 90% 낮은 비용으로 동일하게 처리

사후 분석 결과, 이 도구가 품질 저하 없이 AI 지출의 50-70%를 절감했을 것으로 나타났습니다. 조정 후 실제 테스트 프롬프트 12개 중 12개를 올바르게 처리했습니다.

해결하는 문제

문제는 지식이 아니라 마찰입니다. 개발자들은 모델을 전환해야 한다는 것을 알고 있지만, 집중 상태에서는 드롭다운 메뉴를 생각하고 싶어하지 않습니다. 이 도구는 의사 결정 과정을 자동화합니다.

📖 전체 소스 읽기: r/ClaudeAI

오픈소스 로컬 훅이 AI 비용을 절감하기 위해 Claude 모델을 자동으로 전환합니다

작동 방식

주요 기능

기술적 세부사항

성능 및 테스트

해결하는 문제

👀 See Also

샤오전: 근본 원인을 세 단계 깊이 파고드는 클로드 코드 기술

Tessera: 여러 개의 클로드 코드 세션을 관리하기 위한 오픈소스 GUI 작업 공간

DreamScape: Claude Code와 MCP로 구동되는 브라우저 기반 3D 월드 빌더

Relvy는 OpenRCA 벤치마크에서 Claude의 근본 원인 분석 정확도를 12%포인트 향상시킵니다.