실무 경험: MCP 서버와 로컬 LLM으로 자동화 스택 대체하기

Ad
설정 및 하드웨어
개발자는 듀얼 3090 시스템에서 Qwen 2.5 32B(양자화)와 Llama 3.3 70B를 혼합 사용합니다. 각 자동화 작업은 고유한 MCP 서버를 가지며, 이 서버는 인간이 아닌 LLM이 사용하는 API처럼 작동하는 도구를 모델에 제공합니다.
잘 작동하는 부분
- 코드 리뷰 자동화: MCP 도구를 통해 모델에 git diff를 제공하면 논리 버그, 누락된 오류 처리, 경쟁 조건 등 실제 문제를 발견합니다. 시니어 개발자 리뷰의 약 70% 수준으로 작동합니다.
- 로그 분석 및 경고: MCP 서버가 ELK 스택에 연결되어 모델이 이상 패턴을 모니터링합니다. Grafana 경고가 발생하기 전에 3건의 프로덕션 문제를 발견했습니다. 핵심은 시스템의 '정상' 상태에 대한 충분한 컨텍스트를 제공하는 것입니다.
- 문서 생성: 모델이 MCP 파일 도구를 통해 코드베이스를 읽고 API 문서를 생성/업데이트하여 주당 수 시간을 절약하며, 실제로 좋은 출력 품질을 제공합니다.
Ad
아직 작동하지 않는 부분
- 다단계 추론 체인: 3-4개 이상의 도구 호출이 순차적으로 필요한 작업은 모델이 원래 목표의 컨텍스트를 잃어버리기 시작하면서 제대로 작동하지 않습니다. 작은 컨텍스트 윈도우는 이 문제를 더 악화시킵니다. 사고 과정 프롬프팅이 도움이 되지만 완전히 해결되지는 않습니다.
- 실시간 의사 결정: 70B 모델의 지연 시간으로 인해 시간에 민감한 작업에는 사용할 수 없습니다. 코드 리뷰 파이프라인은 PR당 2-3분이 소요되어 비동기 워크플로에는 적합하지만 실시간 애플리케이션에는 쓸모가 없습니다.
- 창의적 문제 해결: 로컬 모델은 훈련 데이터에 잘 표현되지 않은 접근 방식이 필요한 작업에 어려움을 겪습니다. API 모델(Claude, GPT-4)은 이 부분에서 눈에 띄게 더 나은 성능을 보입니다.
핵심 아키텍처 교훈
- MCP 서버를 무상태로 유지하세요. 모델이 서버 측 세션이 아닌 도구 호출을 통해 상태를 관리하도록 합니다.
- 재시도 로직을 서버가 아닌 MCP 클라이언트에 구축하세요. 모델은 약 5%의 확률로 잘못된 도구 호출을 합니다.
- 모델이 예상치 못한 동작을 할 때 디버깅을 위해 모든 도구 호출과 응답을 기록하세요.
- 다운스트림 시스템이 소비하는 모든 것에는 구조화된 출력(JSON 모드)을 사용하세요. 자유 형식 텍스트 출력은 디버깅 악몽입니다.
📖 전체 출처 읽기: r/LocalLLaMA
Ad
👀 See Also

Use Cases
솔로 개발자가 Claude 코드로 야외 플랫폼을 구축하다: AI 지원 제품 개발의 교훈
6년 경력의 소프트웨어 엔지니어가 풀타임으로 근무하면서 클로드 코드를 사용해 수개월에 걸쳐 12개 이상의 데이터 소스를 갖춘 야외 경로 플랫폼인 PathQuest를 구축했습니다. 그는 AI 지원 개발 관리에 관한 구체적인 워크플로우 세부사항과 교훈을 공유합니다.
OpenClawRadar

Use Cases
OpenClaw와 n8n 통합을 통한 배치 이미지 생성
한 개발자가 OpenClaw를 사용해 의도 이해와 n8n을 사용한 일괄 이미지 생성을 위한 워크플로우를 공유하며, Google Sheets를 조직에 활용했습니다. 이 설정은 Atlas Cloud를 통해 MiniMax M2.7을 사용하며, 계획과 실행을 분리해 토큰을 절약합니다.
OpenClawRadar

Use Cases
Claude 프로젝트 + 감마 커넥터: 월 12,000달러 MRR SaaS 창업자의 12분 투자자 업데이트
인도 과외 교사를 위한 SaaS를 운영하는 창업자($12K MRR)가 Claude Projects(영구 컨텍스트)와 Gamma 커넥터를 사용하여 투자자 업데이트 시간을 3시간에서 12분으로 단축한 방법을 공유합니다.
OpenClawRadar

Use Cases
Claude를 활용해 PainSignal 구축하기: 실제 비즈니스 문제 1,000개 데이터베이스
한 개발자가 Claude Code를 사용하여 트럭 운송 및 청소와 같은 산업에서 1,000개의 실제 비즈니스 문제를 정리하는 플랫폼인 PainSignal을 구축했습니다. Claude는 데이터 분류, 기회 클러스터링 및 앱 개념 생성을 처리했습니다.
OpenClawRadar