Bifrost LLM Gateway: 11 микросекунд накладных расходов, единый бинарный файл на Go

✍️ OpenClawRadar📅 Опубликовано: 27 февраля 2026 г.🔗 Source
Bifrost LLM Gateway: 11 микросекунд накладных расходов, единый бинарный файл на Go
Ad

Что такое Bifrost

Bifrost — это готовый прокси для LLM, написанный на Go, специально для саморазмещаемых сред. Он маршрутизирует запросы к OpenAI, Anthropic, Azure, Bedrock и другим провайдерам, одновременно обрабатывая отказоустойчивость, кэширование и контроль бюджета.

Тесты производительности

Разработчик провёл тестирование с устойчивой нагрузкой в 5 000 запросов в секунду:

  • Bifrost (Go): ~11 микросекунд накладных расходов на запрос
  • LiteLLM (Python): ~8 миллисекунд накладных расходов на запрос

Это примерно в 700 раз меньше накладных расходов.

Сравнение использования памяти

При той же пропускной способности:

  • Bifrost: ~50 МБ ОЗУ в базовом режиме, остаётся стабильным под нагрузкой
  • LiteLLM: ~300-400 МБ ОЗУ в базовом режиме, скачки до 800+ МБ при высокой нагрузке

Разработчик отмечает, что для работы LiteLLM при 2k+ RPS требуется горизонтальное масштабирование и серьёзные размеры инстансов, в то время как Bifrost обрабатывает 5k RPS на VPS за $20 в месяц.

Ad

Стабильность под нагрузкой

Производительность Bifrost остаётся постоянной под нагрузкой с одинаковой задержкой как при 100 RPS, так и при 5 000 RPS. В отличие от этого, LiteLLM становится непредсказуемым при скачках трафика — увеличивается вариативность задержек, возникают скачки памяти, а паузы сборки мусора происходят в самые неподходящие моменты.

Уникальные возможности

Bifrost включает шлюз MCP, который подключает 10+ серверов инструментов MCP, обрабатывает обнаружение, пространства имён, проверки работоспособности и фильтрацию инструментов для каждого запроса. LiteLLM не поддерживает MCP.

Развёртывание и миграция

Развёртывание представляет собой один бинарный файл без виртуальных окружений Python, без проблем с зависимостями и без необходимости в Docker. Вы просто копируете его на сервер и запускаете.

Для миграции API совместим с OpenAI. Вы меняете базовый URL и сохраняете существующий код, при этом большинство миграций занимает менее часа.

Доступность в открытом исходном коде

Проект имеет открытый исходный код и доступен на github.com/maximhq/bifrost.

📖 Read the full source: r/clawdbot

Ad

👀 Смотрите также

OpenCortex: Самообучающаяся система памяти для OpenClaw
Инструменты

OpenCortex: Самообучающаяся система памяти для OpenClaw

OpenCortex заменяет плоский файл MEMORY.md в OpenClaw структурированными файлами памяти, организованными по проектам, контактам, рабочим процессам, настройкам, руководствам, инструментам и инфраструктуре. Он включает ежедневную дистилляцию с аудитами соблюдения принципов и еженедельный синтез с обнаружением паттернов и автоматическим созданием руководств.

OpenClawRadar
Открытая система разработки продуктов с 31 агентом для Claude, содержащая более 12 000 строк контента.
Инструменты

Открытая система разработки продуктов с 31 агентом для Claude, содержащая более 12 000 строк контента.

Открытый навык Claude предоставляет 31 специализированного ИИ-агента и 20 стратегических фреймворков, охватывающих все отделы компании от продукта до соответствия требованиям. Система с лицензией MIT включает 62 файла с более чем 12 000 строк практического контента, страновую специфику соответствия для нескольких регионов и интеллектуальную систему загрузки, которая эффективно маршрутизирует запросы.

OpenClawRadar
ClaudeOrb: Расширение для Chrome отслеживает использование Claude API в реальном времени
Инструменты

ClaudeOrb: Расширение для Chrome отслеживает использование Claude API в реальном времени

Разработчик создал ClaudeOrb — бесплатное расширение для Chrome, которое отображает процент использования сессии Claude, недельные лимиты, таймеры обратного отсчета, стоимость Claude Code и тренды расходов за 7 дней. Инструмент был создан с помощью Claude Code после того, как разработчик столкнулся с ограничениями скорости без предупреждения.

OpenClawRadar
Нужен MCP-сервер, обеспечивающий семантическое обнаружение инструментов для AI-агентов.
Инструменты

Нужен MCP-сервер, обеспечивающий семантическое обнаружение инструментов для AI-агентов.

Сервер MCP под названием Need обеспечивает семантический поиск по более чем 10 000 инструментам из brew, npm, pip и cargo. Когда агент запрашивает задачу, например, 'сжать эти PNG-файлы', он находит pngquant, устанавливает его, запускает и сообщает об успехе.

OpenClawRadar