오픈소스 SourceBridge: 로컬 LLM으로 코드베이스 분석하는 방법

SourceBridge는 로컬 LLM을 사용하여 코드베이스의 구조적 이해를 구축하는 오픈소스 프로젝트입니다. Git 저장소를 지정하면 코드베이스를 파일, 함수, 클래스, 의존성을 포함하는 심볼 그래프로 색인화합니다. 이 도구는 사용자의 LLM을 활용하여 개별 코드 세그먼트에서 시작해 파일, 패키지, 전체 저장소로 이어지는 계층적 이해 트리를 구축합니다.

생성하는 내용

요약 노트: 실제 코드를 기반으로 한 다단계 요약
코드 투어: 특정 파일/함수 참조가 포함된 아키텍처 기반 둘러보기
학습 경로: 교육학적으로 구조화된 온보딩 자료
워크플로우 스토리: 시스템 내 데이터 흐름 추적
저장소 그래프에 대한 의미론적 검색

로컬 모델 지원

로컬 모델 지원은 처음부터 우선순위였습니다. 현재 지원되는 백엔드에는 다음이 포함됩니다:

Ollama — 주요 로컬 백엔드, 개발자가 매일 테스트하는 환경
llama.cpp — 직접 llama-server 지원, 테스트에서 Ollama보다 약간 빠름
vLLM — GPU 서버용
LM Studio — 추측 디코딩 포함
SGLang — 다중 GPU 설정용

모든 백엔드는 OpenAI 호환 API를 통해 작동하므로 해당 프로토콜을 지원하는 모든 것이 작동합니다. 특정 작업에서 더 높은 품질이 필요할 때를 위해 클라우드 제공업체(Anthropic, OpenAI, Gemini, OpenRouter)도 지원됩니다.

모델 성능

개발자는 주로 Mac Studio에서 llama.cpp를 통해 Qwen 3.5 35B-A3B(MoE, 활성 매개변수 3B만)로 실행해 왔습니다. Q4_K_XL 양자화에서 약 50 토큰/초로 실행되며 견고한 요약 노트와 코드 투어를 생성합니다. 더 큰 저장소의 경우 Ollama를 통해 Qwen 3.5 122B-A10B가 테스트되었습니다 — 더 나은 지시 따르기를 보여주지만 약 76GB RAM이 필요합니다.

이해 작업(코드 요약, 이해 트리 구축)의 경우 32B급 모델이 합리적인 성능을 발휘합니다. 로컬과 클라우드 모델 간의 품질 차이는 눈에 띄지만 대부분의 사용 사례에서 결정적이지는 않습니다. 복잡한 형식 지정 지침을 반복 없이 따르도록 LLM이 필요한 보고서 스타일 생성에서는 클라우드 모델이 여전히 분명히 우위를 점합니다.

Qwen 3.5 모델의 사고 모드는 기본적으로 비활성화되어 있습니다 — 이해 출력을 개선하지 않는 추론 체인에 토큰을 낭비하기 때문입니다. 실험을 원할 경우 환경 변수를 통해 구성할 수 있습니다.

아키텍처

Go API 서버(색인화, 인증, 작업 큐, 그래프 저장소)
Python gRPC 워커(LLM 호출, 이해 파이프라인, 아티팩트 생성)
Next.js 웹 UI(실시간 진행 상황, 마크다운 뷰어)
SurrealDB(그래프 데이터, 지식 아티팩트, 작업 상태)
세 가지 구성 요소 모두 Docker화되어 docker compose up으로 실행

워커는 큐잉, 재시도, 백오프, 취소를 처리합니다 — 따라서 로컬 모델이 느리거나 생성 중간에 충돌하더라도 시스템은 작업을 잃지 않고 정상적으로 복구됩니다.

시작하기

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# config.toml 편집 — llm.provider를 Ollama/llama.cpp 인스턴스로 지정
docker compose up

사용자의 코드는 기기를 떠나지 않습니다. LLM 추론은 로컬에 유지됩니다. 선택적 익명 원격 측정이 있습니다(설치 수만 집계, DO_NOT_TRACK=1로 비활성화 가능).

개발자는 로컬 모델을 실행하는 사용자들로부터 피드백을 찾고 있습니다. 특히 어떤 모델이 가장 우수한 이해 출력을 생성하는지, MoE 모델이 밀집 모델 대비 RAM 절충 가치가 있는지, 특정 백엔드 관련 문제가 있는지에 관한 의견을 원합니다.

📖 전체 Source 읽기: r/LocalLLaMA