프로덕션 AI IDE에서 Ollama를 지원하는 다중 제공자 LLM 폴백 체인

✍️ OpenClawRadar📅 게시일: March 25, 2026🔗 Source

프로덕션 AI IDE에서 Ollama를 지원하는 다중 제공자 LLM 폴백 체인

Ad

프로덕션 AI IDE 플랫폼인 Resonant Genesis는 아키텍처에서 로컬 LLM 지원을 1급 제공자로 통합했습니다. 이 플랫폼은 30개 이상의 마이크로서비스에서 실행되며 로컬 모델을 Groq, OpenAI, Anthropic, Gemini와 같은 클라우드 제공자와 동등하게 취급합니다.

아키텍처와 통합

이 플랫폼은 모든 서비스에 볼륨 마운트된 공유 rg_llm 라이브러리인 UnifiedLLMClient를 사용합니다. LLM 기능이 필요한 모든 마이크로서비스는 이 동일한 클라이언트를 임포트합니다. 폴백 체인은 Groq → OpenAI → Anthropic → Gemini → Ollama/LM Studio 순으로 구성됩니다.

IDE의 씬 클라이언트 확장은 로컬 Ollama 모델을 자동으로 탐지하여 제공자 목록에 추가합니다. 사용자는 원하는 경우 시스템을 로컬 모델을 우선적으로 사용하도록 구성할 수 있습니다.

서버 측 오케스트레이션

모든 오케스트레이션은 서버 측에서 이루어지며, IDE는 UI를 렌더링하고 로컬 도구(파일 작업, 터미널, git)를 실행하며 Server-Sent Events(SSE)를 통해 결과를 스트리밍하는 씬 클라이언트 역할을 합니다. 에이전트 루프, 도구 선택, 시스템 프롬프트, LLM 라우팅은 모두 서버에서 처리됩니다.

로컬 모델을 사용할 때도 동일한 통제된 실행 파이프라인을 거칩니다:

사전 실행 정책 적용(작업 실행 전 차단)
제공자 API를 통한 네이티브 함수 호출(JSON 프롬프트 주입 없음)
모든 에이전트에 대한 암호화된 신원(Ethereum L2의 DSID)
선택한 LLM 제공자에 관계없이 사용 가능한 동일한 59개의 로컬 도구

Ad

로컬 LLM 사용자를 위한 이점

로컬에서 Ollama를 실행하는 사용자에게 이 아키텍처는 다음과 같은 이점을 제공합니다:

프라이버시: 씬 클라이언트 아키텍처는 바이너리에 회사 인텔리전스가 없음을 의미하며, 로컬 모델을 사용하면 프롬프트가 로컬에 유지됩니다
도구 사용: 프롬프트 주입된 JSON 스키마가 아닌 네이티브 함수 호출을 지원하는 59개의 로컬 도구
폴백: 로컬 모델이 복잡한 작업을 처리할 수 없는 경우 자동으로 클라우드 제공자로 폴백됩니다

개발자들은 로컬 모델을 실행하는 사용자들로부터 피드백을 구하고 있으며, 특히 작은 모델의 함수 호출 성능과 에이전트 도구 사용에 적합한 모델에 관한 의견을 원합니다.

이 프로젝트는 GitHub에서 오픈 소스로 제공되며, 도구 생태계를 시연하는 게스트 채팅은 dev-swat.com에서 라이브로 운영됩니다(클라우드 모델 사용).

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

Logseq Brain v0.6.0: Claude Code를 위한 지속 메모리 플러그인, 여정 로그 및 섹션 타겟 읽기 추가

Logseq Brain v0.6.0: Claude Code를 위한 지속 메모리 플러그인, 여정 로그 및 섹션 타겟 읽기 추가

Logseq Brain v0.6.0은 모든 작업에 대한 여정 로그, 토큰 절감을 위한 섹션 타겟 읽기, 스킬 파일의 점진적 공개를 추가했습니다.

May 5, 2026, 12:20 AM UTC

병목 현상: 인간 승인 대기열로 인한 병목

병목 현상: 인간 승인 대기열로 인한 병목

병렬로 여러 Claude Code 에이전트를 실행하는 개발자가 '병목자'를 설명합니다. 병목자는 병렬 처리가 출력을 늘리는 대신 인간의 승인 백로그를 생성하는 지점입니다. 그들의 해결책: 목표를 하위 작업으로 분해하고, 에이전트를 실행하며, 해결되지 않은 결정에 대해서만 알림을 보내는 플래너입니다.

May 19, 2026, 06:17 AM UTC

AutoProber: 하드웨어 해킹을 위한 AI 기반 비행 프로브 자동화

AutoProber: 하드웨어 해킹을 위한 AI 기반 비행 프로브 자동화

AutoProber는 하드웨어 해커를 위한 플라잉 프로브 자동화 스택으로, AI 에이전트가 타겟을 탐지하고, 현미경 이미지를 매핑하며, 안전 모니터링 CNC 동작을 수행하고, 프로브를 검토하며, 제어된 핀 프로빙을 할 수 있도록 합니다. 여기에는 Python 제어 코드, 웹 대시보드, CAD 파일이 포함되며, GRBL CNC 컨트롤러, USB 현미경, 오실로스코프 안전 모니터링과 함께 작동합니다.

Apr 18, 2026, 05:45 PM UTC

음성, 채팅 및 화면 공유를 통해 미팅 참가자로 OpenClaw 에이전트 보내기

음성, 채팅 및 화면 공유를 통해 미팅 참가자로 OpenClaw 에이전트 보내기

새로운 스킬을 통해 OpenClaw 에이전트가 Google Meet, Teams, Zoom에서 음성(STT/TTS), 채팅, 비디오 아바타, 화면 공유를 사용하여 완전한 참가자로 참여할 수 있습니다.

May 24, 2026, 12:18 AM UTC