Много-провайдерская цепочка отказов LLM с поддержкой Ollama в производственной AI IDE

Resonant Genesis, производственная платформа AI IDE, интегрировала поддержку локальных LLM как полноценного провайдера в своей архитектуре. Платформа работает на более чем 30 микросервисах и рассматривает локальные модели как равные облачным провайдерам, таким как Groq, OpenAI, Anthropic и Gemini.
Архитектура и интеграция
Платформа использует общую библиотеку rg_llm под названием UnifiedLLMClient, которая монтируется по всем сервисам. Каждый микросервис, которому нужны возможности LLM, импортирует этого же клиента. Цепочка отказов настроена как: Groq → OpenAI → Anthropic → Gemini → Ollama/LM Studio.
Тонкое клиентское расширение IDE автоматически обнаруживает локальные модели Ollama и добавляет их в список провайдеров. Пользователи могут настроить систему для приоритетного использования локальных моделей, если захотят.
Оркестрация на стороне сервера
Вся оркестрация происходит на стороне сервера, а IDE выступает в качестве тонкого клиента, который отображает интерфейс, выполняет локальные инструменты (файловые операции, терминал, git) и передаёт результаты через Server-Sent Events (SSE). Агентский цикл, выбор инструментов, системные промпты и маршрутизация LLM — всё это происходит на сервере.
При использовании локальной модели она всё равно проходит через тот же управляемый конвейер выполнения:
- Применение политик до выполнения (блокирует действия до их запуска)
- Нативный вызов функций через API провайдеров (без инъекции JSON в промпты)
- Криптографическая идентификация (DSID на Ethereum L2) для каждого агента
- Те же 59 локальных инструментов доступны независимо от выбранного провайдера LLM
Преимущества для пользователей локальных LLM
Для пользователей, запускающих Ollama локально, эта архитектура предоставляет:
- Конфиденциальность: Архитектура тонкого клиента означает отсутствие корпоративной разведки в бинарном файле, а с локальными моделями промпты остаются локальными
- Использование инструментов: 59 локальных инструментов с нативным вызовом функций, а не с инъекцией JSON-схем в промпты
- Откат: Если локальная модель не справляется со сложной задачей, она автоматически переключается на облачные провайдеры
Разработчики ищут отзывы от людей, использующих локальные модели, особенно о производительности вызова функций с меньшими моделями и о том, какие модели хорошо работают для агентского использования инструментов.
Проект имеет открытый исходный код на GitHub, а гостевой чат, демонстрирующий экосистему инструментов, доступен на dev-swat.com (использует облачные модели).
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Постоянные индексы вместо извлечения: архитектура сервера MCP для YouTube
Разработчик делится архитектурными заметками по созданию YouTube MCP-сервера, который использует постоянные локальные индексы вместо распространённого паттерна «извлечь и забыть». Ключевые решения включают трёхуровневую систему резервирования, SQLite + sqlite-vec для векторного хранения, абстракцию провайдеров эмбеддингов и отдельный индекс визуального поиска.

Intuno: Открытая сеть для обнаружения и взаимодействия ИИ-агентов
Intuno — это открытая сеть, где ИИ-агенты регистрируют свои возможности, находят друг друга через семантический поиск и вызывают функции с помощью трёх строк кода на Python. Включает интеграцию с MCP для использования в Claude Desktop или Cursor.

TeenyApp позволяет Claude создавать и развертывать полнофункциональные веб-сайты из одного чат-ссылки
TeenyApp предоставляет живой поддомен и токен агента, которые Claude может использовать через HTTP для создания кода, выполнения миграций, настройки аутентификации и развертывания непосредственно на реальный URL, не покидая чат.

Пользователи OpenClaw сообщают о проблемах с планированием и проверкой при использовании ИИ-агентов.
Пользователи OpenClaw описывают процессы планирования и проверки как 'похожие на MS-DOS', несмотря на эффективную генерацию кода, ссылаясь на необходимость ручного вмешательства, фрагментацию документов и потерю логики при совместной работе агентов. Некоторые экспериментируют с редакторами документов, созданными специально для агентов, такими как comment.io и Proof by Every.