로컬 LLM을 클로드 코드 서브에이전트로 사용하여 컨텍스트 사용량 줄이기

✍️ OpenClawRadar📅 게시일: March 2, 2026🔗 Source
로컬 LLM을 클로드 코드 서브에이전트로 사용하여 컨텍스트 사용량 줄이기
Ad

r/LocalLLaMA의 한 개발자가 Claude Code를 사용하여 LM Studio를 통해 실행되는 로컬 LLM에 작업을 위임하는 방법을 보여주며, 파일 내용을 로컬에 유지함으로써 Claude의 컨텍스트 사용을 줄입니다.

작동 방식

이 시스템은 에이전트 루프를 실행하는 작은 Python 스크립트(~120줄, 표준 라이브러리만 사용)를 사용합니다:

  • 파일 내용 없이 작업 설명을 Claude에 전달합니다
  • 스크립트는 read_filelist_dir 도구 정의와 함께 LM Studio의 /v1/chat/completions 엔드포인트로 전송합니다
  • 로컬 모델은 필요한 파일을 읽기 위해 해당 도구를 직접 호출합니다
  • 최종 답변을 생성할 때까지 루프가 계속됩니다
  • Claude는 파일 내용이 아닌 결과만 확인합니다

사용 예시

python3 agent_lm.py --dir /path/to/project "solar-system.html 요약"
# [턴 1] → read_file({'path': 'solar-system.html'})
# [턴 2] → 이 HTML 파일은 대화형 애니메이션 태양계를 생성합니다...

파일 내용은 Claude의 컨텍스트가 아닌 로컬 모델의 컨텍스트로 들어갑니다(Apple Silicon에서 MLX를 통해 Qwen3.5 35B 4비트로 테스트됨).

적합한 용도

  • 코드 요약 및 설명
  • 버그 찾기
  • 보일러플레이트 / 초안 생성
  • 텍스트 변환 및 번역(히브리어로 테스트됨)
  • 논리 작업 및 추론(더 어려운 문제에는 --think 플래그 사용)
Ad

적합하지 않은 용도

  • 관계가 중요한 다중 파일 이해와 같이 Claude의 전체 컨텍스트가 필요한 작업
  • 현재 대화 기록이 필요한 작업
  • 정확성이 중요한 모든 작업

저자는 이를 "하이쿠 수준의 보조 도구이지 대체품이 아니다"라고 설명합니다.

설정

  • API 서버가 활성화된 로컬에서 실행되는 LM Studio
  • 에이전트 루프용 Python 스크립트 하나, 간단한 프롬프트 전용 쿼리용 스크립트 하나
  • 둘 다 전역 ~/.claude/CLAUDE.md에 연결되어 Claude Code가 관련 시 위임을 제공할 수 있도록 함
  • MCP 서버, pip 종속성, 플러그인 인프라가 필요 없음
  • 권장: jinja 템플릿 상단에 {%- set enable_thinking = false %} 추가 - 대부분의 작업에서 품질 저하 없이 시간과 토큰을 절약합니다

저자는 Claude가 게시물 작성에 도움을 주었지만 감독과 수정을 거쳤으며, 관심이 있다면 스크립트를 공유할 수 있다고 언급했습니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

CtxSnap VS Code 확장 프로그램은 Claude 세션의 파일 변경 사항을 추적합니다
Tools

CtxSnap VS Code 확장 프로그램은 Claude 세션의 파일 변경 사항을 추적합니다

CtxSnap은 VS Code 확장 프로그램으로, 마지막 Claude 세션 이후 변경된 파일을 추적하고 파일 내용과 Claude의 200k 컨텍스트 윈도우에 맞춘 토큰 예산 표시줄을 포함한 바로 붙여넣기 가능한 인계 블록으로 패키징합니다.

OpenClawRadar
Atoo Studio: 다중 프로젝트 Claude 코드 워크플로우 관리를 위한 오픈소스 작업 공간
Tools

Atoo Studio: 다중 프로젝트 Claude 코드 워크플로우 관리를 위한 오픈소스 작업 공간

Atoo Studio는 여러 프로젝트에서 Claude Code를 사용할 때 발생하는 터미널과 탭 혼란을 해결하기 위해 구축된 오픈소스 작업 공간입니다. Git 브랜치와 같은 세션 포킹을 도입하며 Claude Code, Codex CLI, Gemini CLI 간 연속 작업을 가능하게 합니다.

OpenClawRadar
마에스트로 v1.5.0은 다중 에이전트 오케스트레이션을 위한 Claude Code 지원을 추가합니다.
Tools

마에스트로 v1.5.0은 다중 에이전트 오케스트레이션을 위한 Claude Code 지원을 추가합니다.

오픈소스 멀티에이전트 오케스트레이션 플랫폼인 Maestro v1.5.0이 이제 Gemini CLI 외에도 Claude Code에서 네이티브 플러그인으로 실행됩니다. 이 업데이트에는 심화된 설계 계획, 42단계 오케스트레이션 백본, 에이전트 역량 강화, 보안 강화가 포함됩니다.

OpenClawRadar
OpenClaw 벤치마크, Qwen3.5:27B가 에이전트 작업에서 다른 로컬 LLMs보다 성능 우위 보여
Tools

OpenClaw 벤치마크, Qwen3.5:27B가 에이전트 작업에서 다른 로컬 LLMs보다 성능 우위 보여

OpenClaw를 사용하여 22가지 실제 에이전트 작업에 대해 7개의 로컬 LLM을 벤치마킹한 결과, qwen3.5:27b-q4_K_M이 59.4%로 가장 높은 점수를 기록했으며, 2위인 qwen3.5:35b는 23.2%에 그쳤습니다. 대부분의 모델은 이메일 기능과 같은 기본 도구를 찾지 못했습니다.

OpenClawRadar