라우터리: 런타임 라우팅 정책과 예산 제어 기능을 갖춘 셀프 호스팅 LLM 게이트웨이

✍️ OpenClawRadar📅 게시일: April 19, 2026🔗 Source
라우터리: 런타임 라우팅 정책과 예산 제어 기능을 갖춘 셀프 호스팅 LLM 게이트웨이
Ad

Routerly는 기존 솔루션의 격차를 해결하기 위해 구축된 셀프 호스팅 LLM 게이트웨이입니다. 개발자는 OpenRouter가 클라우드 기반이고, 자신의 인프라에서 실행 가능한 무언가를 원했으며, LiteLLM의 라우팅은 예산 관리가 잘 되더라도 너무 수동적으로 느껴졌기 때문에 이를 만들었습니다.

핵심 기능

애플리케이션에 특정 모델을 하드코딩하는 대신, Routerly를 사용하면 런타임에 모델 선택을 결정하는 라우팅 정책을 정의할 수 있습니다. 사용 가능한 정책은 다음과 같습니다:

  • 가장 저렴한
  • 가장 빠른
  • 가장 능력 있는
  • 이러한 정책들의 조합

예산 제어는 실제 토큰당 추적과 함께 프로젝트 수준에서 작동하여 세분화된 비용 관리를 제공합니다.

호환성 및 사용

Routerly는 OpenAI와 호환되므로 코드 변경 없이 기존 워크플로에 바로 적용할 수 있습니다. 구체적으로 언급된 호환 도구는 다음과 같습니다:

  • Cursor
  • LangChain
  • Open WebUI

이는 OpenAI API 형식을 사용하는 "그 외 모든 것"과도 작동합니다.

현재 상태

개발자는 아직 부족한 부분이 있음을 인정하고 커뮤니티의 피드백을 구하고 있습니다:

  • 무엇이 고장 났는지
  • 무엇이 누락되었는지
  • 라우팅 로직이 실제로 합리적인지
  • 사람들이 실제로 겪는 문제를 해결하는지

이 도구는 완전히 무료이며 오픈소스이고, 상업적인 판매 제안은 없습니다. 개발자는 기술 커뮤니티로부터 실용적인 피드백에 집중하고 있습니다.

자료

  • GitHub 저장소: https://github.com/Inebrio/Routerly
  • 웹사이트: https://www.routerly.ai

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

tmux와 Markdown 스펙을 활용한 병렬 코딩 에이전트
Tools

tmux와 Markdown 스펙을 활용한 병렬 코딩 에이전트

마누엘 쉬퍼는 tmux, 마크다운 파일, bash 별칭, 그리고 여섯 개의 슬래시 명령어를 사용한 경량 설정으로 병렬 코딩 에이전트를 운영하고 있습니다. 이 설정은 Feature Design(FD) 마크다운 스펙을 사용하며, 이를 8단계 라이프사이클을 통해 추적합니다.

OpenClawRadar
클로드 코드의 병렬 서브 에이전트: 토큰 절약과 소모의 순간
Tools

클로드 코드의 병렬 서브 에이전트: 토큰 절약과 소모의 순간

Anthropic은 멀티 에이전트 시스템이 단일 채팅보다 약 15배 더 많은 토큰을 사용하지만, 프롬프트 캐싱을 통해 토큰 비용을 90% 할인받을 수 있다고 보고합니다. 하위 에이전트가 비용을 절약하거나 낭비하는지는 캐시 적중률에 달려 있습니다.

OpenClawRadar
오픈소스 대시보드가 실제 클로드 코드 컴퓨팅 비용을 공개합니다
Tools

오픈소스 대시보드가 실제 클로드 코드 컴퓨팅 비용을 공개합니다

한 개발자가 Claude Code의 요금 제한 공식을 역공학하여 실시간 사용률 백분율, 실제 달러 비용, 소비 속도, 피크 시간, 그리고 어떤 스킬/훅이 실행 중인지 보여주는 로컬 대시보드를 구축했습니다. 이 도구는 월 100달러 요금제가 한 달 동안 13,286달러 상당의 API 컴퓨팅을 소비했음을 밝혀냈습니다.

OpenClawRadar
MCP-인디아-스택: AI 에이전트를 위한 인도 금융 데이터 오프라인 우선 서버
Tools

MCP-인디아-스택: AI 에이전트를 위한 인도 금융 데이터 오프라인 우선 서버

MCP-India-Stack는 인증이나 외부 API 호출 없이 인도 금융 및 정부 API 기능을 제공하는 오프라인 우선 MCP 서버입니다. 세금 계산, 검증 도구 및 조회를 위해 데이터셋을 로컬에 번들로 제공합니다.

OpenClawRadar