Расширение RelayCode для VS Code направляет код Claude через суверенные RDU.

OpenGPU выпустила RelayCode — расширение для VS Code, которое работает как локальный прокси для ИИ-агентов программирования. Инструмент перехватывает запросы от Claude Code или GitHub Copilot и направляет их через сеть OpenGPU Relay к открытым моделям, работающим на суверенной инфраструктуре.
Ключевые детали
Расширение предоставляет несколько конкретных функций и характеристик производительности:
- Инфраструктура: Рабочие нагрузки направляются через реконфигурируемые блоки потоковой обработки данных (RDUs) от Infercom, которые описываются как выделенные суверенные вычислительные мощности без юрисдикции США и с соблюдением GDPR по дизайну.
- Производительность: Бенчмарки показывают 250+ токенов в секунду на DeepSeek-R1 (671B) и 400+ токенов в секунду на MiniMax M2.5. Переключение между моделями происходит почти мгновенно (миллисекунды) благодаря архитектуре потоковой обработки данных.
- Управление контекстом: Расширение автоматически управляет настройками
CLAUDE_AUTOCOMPACT, чтобы удерживать агентов в пределах контекстных окон моделей без сбоев. - Конфиденциальность: Код остаётся на локальной машине; только запросы на вывод попадают в релейную сеть без сохранения данных.
- Текущий статус: Команда сообщает о примерно 23 установках и ищет отзывы о задержках в релейной сети от сообщества.
- Доступ: Доступны промо-кредиты для бесплатного тестирования скорости RDUs.
Инструмент позиционируется как способ снизить затраты на API Anthropic при сохранении рабочих процессов Claude CLI, что особенно полезно для рефакторинга кода.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Сравнительный обзор быстрого вывода LLM от Anthropic и OpenAI
Антропик и OpenAI недавно представили функции 'быстрого режима', чтобы повысить скорость вывода своих языковых моделей.

Vibe Remote: Мобильный мост для доступа к коду Claude из любой точки
Vibe Remote — это мобильное приложение, которое обеспечивает удалённый доступ к средам разработки Claude Code с телефона, позволяя пользователям сохранять свои локальные конфигурации, историю Git и структуру файлов без необходимости использования Tailscale или сложных VPN-настроек.

Результаты тестирования: система агентов Claude с памятью демонстрирует экономию токенов на 30-43%
Разработчик протестировал рой из 6 агентов Claude на задаче по кодированию из 40 пунктов с использованием пользовательской системы памяти Stompy и без неё. Результаты показали, что Sonnet 4.6 с памятью достиг идеального результата за $3,98 против $7,04 без памяти, в то время как Haiku 4.5 полностью провалился без памяти, но набрал 39/40 с её использованием.

Mandala v0.3: Открытая асинхронная среда выполнения для унификации логистической телеметрии в виде OpenTelemetry-спанов для рассуждений агентов
Mandala v0.3 — это асинхронный рантайм с открытым исходным кодом, который получает телеметрию от Samsara, Descartes, Vizion и FMCSA через вебхуки, генерирует события в виде Span OpenTelemetry и предоставляет данные через MCP-инструменты для LLM-агентов.