Bifrost LLM 게이트웨이: 11마이크로초 오버헤드, Go로 작성된 단일 바이너리

✍️ OpenClawRadar📅 게시일: February 27, 2026🔗 Source
Bifrost LLM 게이트웨이: 11마이크로초 오버헤드, Go로 작성된 단일 바이너리
Ad

Bifrost란 무엇인가

Bifrost는 자체 호스팅 환경을 위해 Go로 특별히 작성된 드롭인 LLM 프록시입니다. OpenAI, Anthropic, Azure, Bedrock 및 기타 제공업체로 요청을 라우팅하면서 장애 조치, 캐싱 및 예산 제어를 처리합니다.

성능 벤치마크

개발자는 초당 5,000건의 요청을 지속적으로 벤치마크했습니다:

  • Bifrost (Go): 요청당 약 11마이크로초 오버헤드
  • LiteLLM (Python): 요청당 약 8밀리초 오버헤드

이는 오버헤드에서 약 700배 차이입니다.

메모리 사용량 비교

동일한 처리량에서:

  • Bifrost: 약 50MB RAM 기준, 부하 하에서도 일정하게 유지
  • LiteLLM: 약 300-400MB 기준, 트래픽이 많을 때 800MB 이상으로 급증

개발자는 LiteLLM을 2k+ RPS로 실행하려면 수평 확장과 강력한 인스턴스 크기가 필요하지만, Bifrost는 월 20달러 VPS에서 5k RPS를 처리한다고 언급합니다.

Ad

부하 하 안정성

Bifrost 성능은 부하 하에서도 일정하게 유지되며, 100 RPS나 5,000 RPS에서 동일한 지연 시간을 보입니다. 반면 LiteLLM은 트래픽이 급증할 때 예측 불가능해집니다 - 지연 시간 변동이 증가하고, 메모리가 급증하며, GC 일시 중지가 최악의 시점에 발생합니다.

독특한 기능

Bifrost에는 10개 이상의 MCP 도구 서버를 연결하고, 검색, 네임스페이싱, 상태 확인 및 요청별 도구 필터링을 처리하는 MCP 게이트웨이가 포함되어 있습니다. LiteLLM은 MCP를 지원하지 않습니다.

배포 및 마이그레이션

배포는 단일 바이너리로 Python 가상 환경, 의존성 문제, Docker 없이 가능합니다. 서버에 복사하여 실행하기만 하면 됩니다.

마이그레이션을 위해 API는 OpenAI와 호환됩니다. 기본 URL을 변경하고 기존 코드를 유지하면 대부분의 마이그레이션이 1시간 이내에 완료됩니다.

오픈소스 가용성

이 프로젝트는 오픈소스이며 github.com/maximhq/bifrost에서 이용 가능합니다.

📖 전체 소스 읽기: r/clawdbot

Ad

👀 See Also

DreamScape: Claude Code와 MCP로 구동되는 브라우저 기반 3D 월드 빌더
Tools

DreamScape: Claude Code와 MCP로 구동되는 브라우저 기반 3D 월드 빌더

DreamScape는 Claude Code가 30개의 MCP 도구를 제어하여 자연어 명령을 통해 실시간으로 지형, 모델, 날씨, 행동을 생성하는 브라우저 기반 3D 월드 빌더입니다.

OpenClawRadar
사서 MCP: 문서와 지속적 컨텍스트를 위한 로컬 AI 서버
Tools

사서 MCP: 문서와 지속적 컨텍스트를 위한 로컬 AI 서버

Librarian MCP는 로컬에서 실행되는 오픈소스 Model Context Protocol 서버로, Jan, LM Studio 또는 Claude Desktop에 연결하여 AI 모델이 문서 컬렉션을 검색하고 분석할 수 있게 하면서도 전체 대화 컨텍스트와 데이터 프라이버시를 유지합니다.

OpenClawRadar
Cull: AI 이미지 파이프라인을 위한 오픈소스 데이터셋 큐레이션 엔진
Tools

Cull: AI 이미지 파이프라인을 위한 오픈소스 데이터셋 큐레이션 엔진

Cull은 Civitai, X/Twitter, Reddit, Discord, booru 사이트 등 340개 이상의 소스에서 이미지를 스크래핑하고, 로컬 LM Studio 또는 Groq를 통해 비전-언어 모델로 분류한 후, SD 프롬프트와 감사 기록과 함께 카테고리 폴더로 정리합니다.

OpenClawRadar
다중 에이전트 하이쿠 시스템, 복잡한 수론 문제에서 클로드 오푸스와 동등한 성능을 15배 낮은 비용으로 달성
Tools

다중 에이전트 하이쿠 시스템, 복잡한 수론 문제에서 클로드 오푸스와 동등한 성능을 15배 낮은 비용으로 달성

레딧 실험에서 하이쿠 에이전트 시스템(생성기 + 감사관)이 어려운 페르마의 소정리 증명에서 Claude Opus 4.5와 동일한 4/4 점수를 달성했으며, 쿼리당 비용은 약 $0.004로 Opus의 $0.06에 비해 훨씬 저렴했습니다.

OpenClawRadar