Qwen3.5 35B-A3B MoE는 중급 사양 하드웨어에서 27단계 에이전트 워크플로우를 로컬에서 실행합니다.

✍️ OpenClawRadar📅 게시일: March 25, 2026🔗 Source
Qwen3.5 35B-A3B MoE는 중급 사양 하드웨어에서 27단계 에이전트 워크플로우를 로컬에서 실행합니다.
Ad

로컬 에이전트 워크플로우 데모

r/LocalLLaMA의 한 개발자가 Qwen3.5 35B-A3B MoE를 사용하여 복잡한 에이전트 워크플로우를 로컬에서 성공적으로 실행했다고 보고했습니다. 이 모델은 중급 사양 하드웨어에서 27단계 비디오 처리 체인을 자율적으로 실행했습니다.

워크플로우 상세

이 작업은 단일 자연어 프롬프트에서 비디오를 처리하는 것을 포함했습니다:

  • 비디오 업로드
  • Whisper로 자막 생성
  • 자막 편집
  • 커스텀 스타일로 비디오에 자막 입히기

워크플로우는 extract_audio, transcribe, read_file, edit_file, burn_subtitles 및 검증 단계를 포함한 27개의 순차적 도구 호출로 구성되었습니다. 모델은 각 단계를 계획, 실행, 검증하고 필요 시 자가 수정했습니다.

Ad

기술 사양

하드웨어:

  • 레노버 ThinkPad P53 모바일 워크스테이션
  • 인텔 i7-9850H 프로세서
  • 쿼드로 RTX 3000 (6GB VRAM)
  • 48GB DDR4 2666MT/s RAM

소프트웨어 스택:

  • llama.cpp + whisper.cpp를 사용한 완전 로컬 구현
  • 클라우드 API 미사용

모델 구성:

  • Q4_K_M 양자화된 Qwen3.5 35B-A3B MoE
  • 토큰당 약 30억 개의 활성 파라미터를 가진 MoE 아키텍처
  • 레이어 오프로딩으로 6GB VRAM에 적합하고 실행 가능
  • 전체 350억 파라미터 지식 베이스

성능 결과

전체 워크플로우는 약 10분 동안 실행되었으며, 대부분의 시간이 추론에 소요되었습니다. 개발자는 27단계 체인 동안 오류 없이 사람의 개입이 필요하지 않았다고 언급했습니다. MoE 아키텍처는 활성 파라미터 수를 낮게 유지하면서 전체 모델 능력을 유지함으로써 중급 하드웨어에서 이를 가능하게 했습니다.

이는 로컬 에이전트 워크플로우가 특히 속도를 위한 활성 파라미터 수와 능력을 위한 전체 파라미터 수를 균형 있게 조절하는 MoE 모델을 통해 소비자급 하드웨어에서 실용화되고 있음을 보여줍니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

OpenClaw 사용자가 정부 포털을 역공학하여 주차 요금 결제를 자동화합니다
Use Cases

OpenClaw 사용자가 정부 포털을 역공학하여 주차 요금 결제를 자동화합니다

OpenClaw 사용자가 지방 정부 포털을 리버스 엔지니어링하여 주차 요금을 자동으로 결제하는 스크립트를 만들었습니다. 이를 통해 Mac mini에서 로컬로 실행하여 거래당 비용을 3달러에서 0달러로 줄였습니다.

OpenClawRadar
셀프 호스팅 OpenClaw AI 에이전트가 개발자를 위한 수동적 책임 시스템을 생성합니다.
Use Cases

셀프 호스팅 OpenClaw AI 에이전트가 개발자를 위한 수동적 책임 시스템을 생성합니다.

맥 미니에서 24시간 OpenClaw를 실행하는 개발자는 AI 에이전트가 작업과 프로젝트를 지속적으로 기억함으로써 효과적인 책임감 시스템을 만들어, 이전에 중단되었던 프로젝트를 완료하는 데 도움이 된다고 보고합니다.

OpenClawRadar
LLM으로 7년간의 일기 분석하기: RAG 대 미세 조정 실패
Use Cases

LLM으로 7년간의 일기 분석하기: RAG 대 미세 조정 실패

2019년부터 일기를 써온 개발자가 200개 이상의 항목을 LLM에 넣어 패턴을 발견하려고 시도했다. RAG는 실패했고, 파인튜닝도 실패했으며, 프라이버시도 제약이었다. 최종 접근법은 2년마다 반복되는 인생 교훈을 밝혀냈다.

OpenClawRadar
Claude를 사용하여 이메일 시스템의 누락된 사용자 시나리오 감사하기
Use Cases

Claude를 사용하여 이메일 시스템의 누락된 사용자 시나리오 감사하기

한 개발자가 Claude를 사용해 데이터베이스 스키마와 이메일 트리거를 분석하여 네 가지 중요한 결함을 발견했습니다: 인증되지 않은 가입자에 대한 후속 조치 부재, 다운그레이드에 대한 확인 부재, 팀 초대 수락 알림 부재, 플랜 한도 도달 경고 부재.

OpenClawRadar