SourceBridge: 로컬 LLM을 사용한 코드베이스 분석을 위한 오픈소스 도구

✍️ OpenClawRadar📅 게시일: April 21, 2026🔗 Source
SourceBridge: 로컬 LLM을 사용한 코드베이스 분석을 위한 오픈소스 도구
Ad

SourceBridge는 로컬 LLM을 사용하여 코드베이스의 구조적 이해를 구축하는 오픈소스 프로젝트입니다. Git 저장소를 지정하면 코드베이스를 파일, 함수, 클래스, 의존성을 포함하는 심볼 그래프로 색인화합니다. 이 도구는 사용자의 LLM을 활용하여 개별 코드 세그먼트에서 시작해 파일, 패키지, 전체 저장소로 이어지는 계층적 이해 트리를 구축합니다.

생성하는 내용

  • 요약 노트: 실제 코드를 기반으로 한 다단계 요약
  • 코드 투어: 특정 파일/함수 참조가 포함된 아키텍처 기반 둘러보기
  • 학습 경로: 교육학적으로 구조화된 온보딩 자료
  • 워크플로우 스토리: 시스템 내 데이터 흐름 추적
  • 저장소 그래프에 대한 의미론적 검색

로컬 모델 지원

로컬 모델 지원은 처음부터 우선순위였습니다. 현재 지원되는 백엔드에는 다음이 포함됩니다:

  • Ollama — 주요 로컬 백엔드, 개발자가 매일 테스트하는 환경
  • llama.cpp — 직접 llama-server 지원, 테스트에서 Ollama보다 약간 빠름
  • vLLM — GPU 서버용
  • LM Studio — 추측 디코딩 포함
  • SGLang — 다중 GPU 설정용

모든 백엔드는 OpenAI 호환 API를 통해 작동하므로 해당 프로토콜을 지원하는 모든 것이 작동합니다. 특정 작업에서 더 높은 품질이 필요할 때를 위해 클라우드 제공업체(Anthropic, OpenAI, Gemini, OpenRouter)도 지원됩니다.

모델 성능

개발자는 주로 Mac Studio에서 llama.cpp를 통해 Qwen 3.5 35B-A3B(MoE, 활성 매개변수 3B만)로 실행해 왔습니다. Q4_K_XL 양자화에서 약 50 토큰/초로 실행되며 견고한 요약 노트와 코드 투어를 생성합니다. 더 큰 저장소의 경우 Ollama를 통해 Qwen 3.5 122B-A10B가 테스트되었습니다 — 더 나은 지시 따르기를 보여주지만 약 76GB RAM이 필요합니다.

이해 작업(코드 요약, 이해 트리 구축)의 경우 32B급 모델이 합리적인 성능을 발휘합니다. 로컬과 클라우드 모델 간의 품질 차이는 눈에 띄지만 대부분의 사용 사례에서 결정적이지는 않습니다. 복잡한 형식 지정 지침을 반복 없이 따르도록 LLM이 필요한 보고서 스타일 생성에서는 클라우드 모델이 여전히 분명히 우위를 점합니다.

Qwen 3.5 모델의 사고 모드는 기본적으로 비활성화되어 있습니다 — 이해 출력을 개선하지 않는 추론 체인에 토큰을 낭비하기 때문입니다. 실험을 원할 경우 환경 변수를 통해 구성할 수 있습니다.

Ad

아키텍처

  • Go API 서버(색인화, 인증, 작업 큐, 그래프 저장소)
  • Python gRPC 워커(LLM 호출, 이해 파이프라인, 아티팩트 생성)
  • Next.js 웹 UI(실시간 진행 상황, 마크다운 뷰어)
  • SurrealDB(그래프 데이터, 지식 아티팩트, 작업 상태)
  • 세 가지 구성 요소 모두 Docker화되어 docker compose up으로 실행

워커는 큐잉, 재시도, 백오프, 취소를 처리합니다 — 따라서 로컬 모델이 느리거나 생성 중간에 충돌하더라도 시스템은 작업을 잃지 않고 정상적으로 복구됩니다.

시작하기

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# config.toml 편집 — llm.provider를 Ollama/llama.cpp 인스턴스로 지정
docker compose up

사용자의 코드는 기기를 떠나지 않습니다. LLM 추론은 로컬에 유지됩니다. 선택적 익명 원격 측정이 있습니다(설치 수만 집계, DO_NOT_TRACK=1로 비활성화 가능).

개발자는 로컬 모델을 실행하는 사용자들로부터 피드백을 찾고 있습니다. 특히 어떤 모델이 가장 우수한 이해 출력을 생성하는지, MoE 모델이 밀집 모델 대비 RAM 절충 가치가 있는지, 특정 백엔드 관련 문제가 있는지에 관한 의견을 원합니다.

📖 전체 Source 읽기: r/LocalLLaMA

Ad

👀 See Also

AI 서브루틴: 제로 토큰 비용으로 결정론적 브라우저 자동화
Tools

AI 서브루틴: 제로 토큰 비용으로 결정론적 브라우저 자동화

rtrvr.ai의 AI 서브루틴은 브라우저 작업을 한 번 기록하여 호출 가능한 도구로 저장하며, 인증이 자동으로 전파된 상태로 웹페이지 컨텍스트 내에서 재실행되어, 반복 작업에 대한 LLM 추론 비용과 비결정성을 제거합니다.

OpenClawRadar
개인정보 보호를 최우선으로 하는 MCP 서버 디렉토리가 데이터 처리 정책을 공개하며 출시되었습니다.
Tools

개인정보 보호를 최우선으로 하는 MCP 서버 디렉토리가 데이터 처리 정책을 공개하며 출시되었습니다.

toolora.dev/mcp-hub의 새 디렉토리는 MCP 서버를 나열하며, 각 서버의 데이터 처리 정책을 문서화합니다. 여기에는 로컬 대 호스팅 분류, 각 도구가 전송하는 데이터, 계정 필요 여부 등이 포함됩니다. 제작자는 또한 개인정보 보호 주장을 검증할 수 있는 브라우저 테스트 방법을 제공합니다.

OpenClawRadar
AI Doomsday Toolbox v0.932는 Android 로컬 AI를 위한 벤치마킹, 데이터셋 생성, 에이전트 작업 공간을 추가합니다.
Tools

AI Doomsday Toolbox v0.932는 Android 로컬 AI를 위한 벤치마킹, 데이터셋 생성, 에이전트 작업 공간을 추가합니다.

AI Doomsday Toolbox v0.932는 Android 기기에서 로컬 LLM 벤치마킹, 텍스트/PDF 파일을 Alpaca JSON 형식으로 변환하는 데이터셋 생성기, Termux 통합 AI 에이전트 작업 공간을 도입했습니다. 이 업데이트에는 Whisper를 이용한 자막 입히기와 내장 Ollama 관리 도구도 포함됩니다.

OpenClawRadar
에이전트 포지: 오픈소스 도구로 클로드 코드를 위한 멀티 에이전트 파이프라인 구축하기
Tools

에이전트 포지: 오픈소스 도구로 클로드 코드를 위한 멀티 에이전트 파이프라인 구축하기

Agent Forge는 사용 사례 설명으로부터 완전한 다중 에이전트 파이프라인을 생성하는 Claude Code 스킬입니다. 이는 기존 다중 에이전트 시스템에서 관찰된 패턴을 기반으로 프롬프트 파일, 오케스트레이터 스크립트, 데이터 흐름 디렉토리 및 GitHub Actions 설정을 생성합니다.

OpenClawRadar